Celem tego wpisu jest wyjaśnienie, jak konwertować PDF na HTML za pomocą C#. Postępując zgodnie z tym przewodnikiem, konwersja dokumentu z formatu PDF na HTML jest prostym procesem. Wystarczy wykonać poniższe czynności, aby przekonwertować plik PDF na HTML w języku C# i przeprowadzić transformację dokumentu.
Kroki, aby przekonwertować PDF na HTML za pomocą C#
- Skonfiguruj wtyczkę GroupDocs.Conversion for .NET z NuGet
- Uwzględnij przestrzeń nazw GroupDocs.Conversion
- Utwórz obiekt klasy Converter i załaduj źródłowy plik PDF
- Utwórz instancję klasy MarkupConvertOptions
- Przekaż parametry, takie jak przekonwertowana nazwa pliku i instancja klasy MarkupConvertOptions do metody Convert klasy Converter
Oto kroki, które należy wykonać, aby zastosować funkcję konwersji formatu C# z formatu PDF na HTML. Na początek tworzona jest instancja klasy Converter w celu załadowania źródłowego dokumentu PDF. Następnie dla dokumentu renderowania utwórz instancję klasy MarkupConvertOptions i ustaw różne właściwości. Na koniec wywołaj metodę Convert i określ wystąpienie klasy MarkupConvertOptions, a także nazwę pliku przekonwertowanego dokumentu.
Kod do konwersji PDF na HTML przy użyciu C#
using System; | |
using GroupDocs.Conversion.Options.Convert; | |
namespace ConvertPdfToHtmlUsingCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to convert PDF to HTML using C# | |
{ | |
// Remove the watermark in output HTML document by adding license | |
string licensePath = "GroupDocs.Conversion.lic"; | |
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License(); | |
lic.SetLicense(licensePath); | |
// Load the source PDF document for conversion to HTML | |
var converter = new GroupDocs.Conversion.Converter("sample.pdf"); | |
// Set the properties for the converted HTML file | |
var convertOptions = new MarkupConvertOptions() | |
{ | |
PageNumber = 1, | |
PagesCount = 2 | |
}; | |
// Convert and save the PDF in HTML format | |
converter.Convert("converted.html", convertOptions); | |
Console.WriteLine("Done"); | |
} | |
} | |
} |
W poprzednim przykładzie pokazaliśmy, jak wygenerować plik HTML z dokumentu PDF przy użyciu kodu C# PDF to HTML. Ponadto zdefiniowaliśmy właściwości konwertowanego dokumentu, takie jak lista indeksów stron i liczba stron. Można jednak dodatkowo ustawić inne właściwości, w tym numer strony początkowej, poziom powiększenia i wiele innych właściwości renderowanego dokumentu.
W naszym ostatnim artykule zbadaliśmy funkcję konwersji dokumentu programu Word do formatu HTML w języku C#. Jeśli chcesz dowiedzieć się więcej, zapoznaj się z samouczkiem na stronie jak przekonwertować dokument Worda na HTML za pomocą C#.