Hoe PDF naar HTML te converteren met C#

Het doel van dit bericht is om u uit te leggen hoe u PDF naar HTML kunt converteren met C#. Als u deze handleiding volgt, is het converteren van een document van PDF naar HTML een eenvoudig proces. U hoeft alleen de onderstaande stappen te volgen om PDF naar HTML te converteren in C# om documenttransformatie uit te voeren.

Stappen om PDF naar HTML te converteren met C#

  1. Setup GroupDocs.Conversion for .NET plug-in van de NuGet
  2. GroupDocs.Conversion naamruimte opnemen
  3. Maak een object van de klasse Converter en laad het bron-PDF-bestand
  4. Maak een instantie van de klasse MarkupConvertOptions
  5. Geef parameters zoals de geconverteerde bestandsnaam en een instantie van de klasse MarkupConvertOptions door aan de Convert-methode van de klasse Converter

Dit zijn de stappen om de C# convert PDF to HTML-mogelijkheid in actie te brengen. Om te beginnen wordt de klasse Converter geïnstantieerd om het bron-PDF-document te laden. Maak vervolgens voor het weergavedocument een instantie van de klasse MarkupConvertOptions en stel verschillende eigenschappen in. Roep ten slotte de methode Convert aan en geef een instantie van de klasse MarkupConvertOptions op, evenals de bestandsnaam van het geconverteerde document.

Code om PDF naar HTML te converteren met C#

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertPdfToHtmlUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert PDF to HTML using C#
{
// Remove the watermark in output HTML document by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source PDF document for conversion to HTML
var converter = new GroupDocs.Conversion.Converter("sample.pdf");
// Set the properties for the converted HTML file
var convertOptions = new MarkupConvertOptions()
{
PageNumber = 1,
PagesCount = 2
};
// Convert and save the PDF in HTML format
converter.Convert("converted.html", convertOptions);
Console.WriteLine("Done");
}
}
}

In het voorgaande voorbeeld hebben we laten zien hoe u een HTML-bestand van een PDF-document kunt genereren met behulp van C# PDF naar HTML-code. Verder hebben we eigenschappen voor het geconverteerde document gedefinieerd, zoals de lijst met pagina-indexen en het aantal pagina’s. U kunt echter nog andere eigenschappen instellen, waaronder het startpaginanummer, het zoomniveau en nog veel meer van het weergavedocument.

In ons laatste artikel hebben we de functie onderzocht van het converteren van een Word-document naar HTML in C#. Als je meer wilt weten, bekijk dan de tutorial op hoe Word-document naar HTML te converteren met C#.

 Nederlands