Jak převést dokument Word do HTML pomocí C#

Tento příspěvek vám ukáže, jak převést dokument Word do HTML pomocí C#. Zaměříme se na vývoj průvodce krok za krokem spolu s ukázkovým kódem pro generování HTML z DOCX pomocí C#. Tento převod dokumentu do formátu HTML lze provést bez potřeby jakéhokoli softwaru třetí strany v jakémkoli operačním systému, včetně MS Windows, Linux a macOS.

Kroky k převodu dokumentu Word do HTML pomocí C#

  1. Nainstalujte GroupDocs.Conversion for .NET ze správce balíčků NuGet
  2. Přidejte odkaz na jmenný prostor GroupDocs.Conversion
  3. Vytvořte instanci třídy Converter a načtěte zdrojový soubor aplikace Word
  4. Inicializujte třídu MarkupConvertOptions pro definování atributů pro převedený dokument
  5. Vyvolat třídu Converter Převést metodu, předat převedený název souboru a instanci třídy MarkupConvertOptions

Jak vidíte, proces vývoje schopnosti převést Word do HTML C# je poměrně přímočarý. Chcete-li začít, stáhněte a nainstalujte příslušný balíček z NuGet a poté na něj odkazujte v kódu. Poté pro transformaci dokumentu vytvořte instanci tříd Converter a MarkupConvertOptions a použijte metodu Convert.

Kód pro převod dokumentu Word do HTML pomocí C#

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertWordDocumentToHtmlUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert Word Document to HTML using C#
{
// Remove the watermark in output HTML file by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source Word file for conversion to HTML
var converter = new GroupDocs.Conversion.Converter("sample.docx");
// Set the convert options for HTML file
var convertOptions = new MarkupConvertOptions();
// Convert and save the DOCX in HTML format
converter.Convert("converted.html", convertOptions);
Console.WriteLine("Done");
}
}
}

Napsali jsme ukázkový kód, který ukazuje, jak používat funkci C# DOCX to HTML k převodu dokumentů. Byla vyřešena základní transformace dokumentů a generování HTML z dokumentu aplikace Word. Tento kód můžete také použít k vylepšení atributů převedeného souboru HTML, jako je seznam indexů stránek, počet stránek, číslo počáteční stránky, úroveň přiblížení a tak dále.

Funkci převodu Excelu do PDF v C# jsme vyvinuli v našem předchozím článku. Pokud se o tom chcete dozvědět více, můžete si přečíst příspěvek na jak převést Excel do PDF v C#.

 Čeština