Как конвертировать PDF в HTML с помощью C#

Цель этого поста — объяснить вам, как конвертировать PDF в HTML с помощью C#. Следуя этому руководству, преобразование документа из PDF в HTML является простым процессом. Вам нужно только выполнить следующие шаги, чтобы конвертировать PDF в HTML на C# для выполнения преобразования документа.

Шаги по преобразованию PDF в HTML с помощью C#

  1. Настройте подключаемый модуль GroupDocs.Conversion for .NET из NuGet.
  2. Включить пространство имен GroupDocs.Conversion
  3. Создайте объект класса Converter и загрузите исходный файл PDF.
  4. Создайте экземпляр класса MarkupConvertOptions
  5. Передайте такие параметры, как преобразованное имя файла и экземпляр класса MarkupConvertOptions, в метод Convert класса Converter.

Это шаги для включения возможности C# конвертировать PDF в HTML* в действие. Для начала создается экземпляр класса Converter для загрузки исходного PDF-документа. Затем для документа визуализации создайте экземпляр класса MarkupConvertOptions и задайте различные свойства. Наконец, вызовите метод Convert и укажите экземпляр класса MarkupConvertOptions, а также имя файла преобразованного документа.

Код для преобразования PDF в HTML с помощью С#

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertPdfToHtmlUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert PDF to HTML using C#
{
// Remove the watermark in output HTML document by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source PDF document for conversion to HTML
var converter = new GroupDocs.Conversion.Converter("sample.pdf");
// Set the properties for the converted HTML file
var convertOptions = new MarkupConvertOptions()
{
PageNumber = 1,
PagesCount = 2
};
// Convert and save the PDF in HTML format
converter.Convert("converted.html", convertOptions);
Console.WriteLine("Done");
}
}
}

В предыдущем примере мы показали, как создать файл HTML из документа PDF с помощью кода C# PDF to HTML. Кроме того, мы определили свойства для преобразованного документа, такие как список индексов страниц и количество страниц. Однако вы можете дополнительно установить другие свойства, включая номер начальной страницы, уровень масштабирования и многие другие параметры документа визуализации.

В нашей прошлой статье мы рассмотрели возможность преобразования документа Word в HTML на языке C#. Если вы хотите узнать больше, ознакомьтесь с учебным пособием на странице как преобразовать документ Word в HTML с помощью C #.

 Русский