Cómo convertir PDF a HTML usando C#

El objetivo de esta publicación es explicarle cómo convertir PDF a HTML usando C#. Siguiendo esta guía, convertir un documento de PDF a HTML es un proceso sencillo. Solo necesita seguir los pasos a continuación para convertir PDF a HTML en C# para realizar la transformación del documento.

Pasos para convertir PDF a HTML usando C#

  1. Configure el complemento GroupDocs.Conversion for .NET desde NuGet
  2. Incluir GroupDocs.Conversion espacio de nombres
  3. Cree un objeto de la clase Converter y cargue el archivo PDF de origen
  4. Crear una instancia de la clase MarkupConvertOptions
  5. Pase parámetros como el nombre del archivo convertido y una instancia de la clase MarkupConvertOptions al método Convert de la clase Converter.

Estos son los pasos para poner en acción la función C# convertir PDF a HTML. Para comenzar, se crea una instancia de la clase Converter para cargar el documento PDF de origen. Luego, para el documento de representación, cree una instancia de la clase MarkupConvertOptions y configure varias propiedades. Finalmente, llame al método Convert y especifique una instancia de la clase MarkupConvertOptions, así como el nombre de archivo del documento convertido.

Código para convertir PDF a HTML usando C#

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertPdfToHtmlUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert PDF to HTML using C#
{
// Remove the watermark in output HTML document by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source PDF document for conversion to HTML
var converter = new GroupDocs.Conversion.Converter("sample.pdf");
// Set the properties for the converted HTML file
var convertOptions = new MarkupConvertOptions()
{
PageNumber = 1,
PagesCount = 2
};
// Convert and save the PDF in HTML format
converter.Convert("converted.html", convertOptions);
Console.WriteLine("Done");
}
}
}

En el ejemplo anterior, mostramos cómo generar un archivo HTML a partir de un documento PDF utilizando el código C# PDF a HTML. Además, hemos definido propiedades para el documento convertido, como la lista de índices de páginas y el número de páginas. Sin embargo, puede configurar otras propiedades, incluido el número de página de inicio, el nivel de zoom y muchas más del documento de representación.

En nuestro último artículo, examinamos la función de convertir un documento de Word a HTML en C#. Si desea obtener más información, consulte el tutorial sobre cómo convertir un documento de Word a HTML usando C#.

 Español