Jak przekonwertować PDF na HTML za pomocą C#

Celem tego wpisu jest wyjaśnienie, jak konwertować PDF na HTML za pomocą C#. Postępując zgodnie z tym przewodnikiem, konwersja dokumentu z formatu PDF na HTML jest prostym procesem. Wystarczy wykonać poniższe czynności, aby przekonwertować plik PDF na HTML w języku C# i przeprowadzić transformację dokumentu.

Kroki, aby przekonwertować PDF na HTML za pomocą C#

  1. Skonfiguruj wtyczkę GroupDocs.Conversion for .NET z NuGet
  2. Uwzględnij przestrzeń nazw GroupDocs.Conversion
  3. Utwórz obiekt klasy Converter i załaduj źródłowy plik PDF
  4. Utwórz instancję klasy MarkupConvertOptions
  5. Przekaż parametry, takie jak przekonwertowana nazwa pliku i instancja klasy MarkupConvertOptions do metody Convert klasy Converter

Oto kroki, które należy wykonać, aby zastosować funkcję konwersji formatu C# z formatu PDF na HTML. Na początek tworzona jest instancja klasy Converter w celu załadowania źródłowego dokumentu PDF. Następnie dla dokumentu renderowania utwórz instancję klasy MarkupConvertOptions i ustaw różne właściwości. Na koniec wywołaj metodę Convert i określ wystąpienie klasy MarkupConvertOptions, a także nazwę pliku przekonwertowanego dokumentu.

Kod do konwersji PDF na HTML przy użyciu C#

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertPdfToHtmlUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert PDF to HTML using C#
{
// Remove the watermark in output HTML document by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source PDF document for conversion to HTML
var converter = new GroupDocs.Conversion.Converter("sample.pdf");
// Set the properties for the converted HTML file
var convertOptions = new MarkupConvertOptions()
{
PageNumber = 1,
PagesCount = 2
};
// Convert and save the PDF in HTML format
converter.Convert("converted.html", convertOptions);
Console.WriteLine("Done");
}
}
}

W poprzednim przykładzie pokazaliśmy, jak wygenerować plik HTML z dokumentu PDF przy użyciu kodu C# PDF to HTML. Ponadto zdefiniowaliśmy właściwości konwertowanego dokumentu, takie jak lista indeksów stron i liczba stron. Można jednak dodatkowo ustawić inne właściwości, w tym numer strony początkowej, poziom powiększenia i wiele innych właściwości renderowanego dokumentu.

W naszym ostatnim artykule zbadaliśmy funkcję konwersji dokumentu programu Word do formatu HTML w języku C#. Jeśli chcesz dowiedzieć się więcej, zapoznaj się z samouczkiem na stronie jak przekonwertować dokument Worda na HTML za pomocą C#.

 Polski