Ten post pokaże Ci, jak konwertować dokument programu Word na format HTML przy użyciu języka C#. Skoncentrujemy się na opracowaniu przewodnika krok po kroku wraz z przykładowym kodem do generowania HTML z DOCX przy użyciu C#. Ta konwersja dokumentu do formatu HTML może zostać przeprowadzona bez oprogramowania innych firm na dowolnym systemie operacyjnym, w tym MS Windows, Linux i macOS.
Kroki, aby przekonwertować dokument programu Word na format HTML przy użyciu języka C#
- Zainstaluj GroupDocs.Conversion for .NET z menedżera pakietów NuGet
- Dodaj odwołanie do przestrzeni nazw GroupDocs.Conversion
- Utwórz instancję klasy Converter i załaduj źródłowy plik Word
- Zainicjuj klasę MarkupConvertOptions do definiowania atrybutów konwertowanego dokumentu
- Wywołaj metodę Converter klasy Convert, przekaż przekonwertowaną nazwę pliku i instancję klasy MarkupConvertOptions
Jak widać, proces rozwijania funkcji convert Word to HTML C# jest dość prosty. Aby rozpocząć, pobierz i zainstaluj odpowiedni pakiet z NuGet, a następnie odwołaj się do niego w kodzie. Następnie w celu przekształcenia dokumentu utwórz instancję klas Converter i MarkupConvertOptions i użyj metody Convert.
Kod do konwersji dokumentu programu Word na HTML przy użyciu języka C#
using System; | |
using GroupDocs.Conversion.Options.Convert; | |
namespace ConvertWordDocumentToHtmlUsingCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to convert Word Document to HTML using C# | |
{ | |
// Remove the watermark in output HTML file by adding license | |
string licensePath = "GroupDocs.Conversion.lic"; | |
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License(); | |
lic.SetLicense(licensePath); | |
// Load the source Word file for conversion to HTML | |
var converter = new GroupDocs.Conversion.Converter("sample.docx"); | |
// Set the convert options for HTML file | |
var convertOptions = new MarkupConvertOptions(); | |
// Convert and save the DOCX in HTML format | |
converter.Convert("converted.html", convertOptions); | |
Console.WriteLine("Done"); | |
} | |
} | |
} |
Napisaliśmy przykładowy kod, aby pokazać, jak używać funkcji C# DOCX do HTML do konwertowania dokumentów. Zajęto się podstawową transformacją dokumentu i generowaniem kodu HTML z dokumentu programu Word. Możesz także użyć tego kodu do ulepszenia atrybutów przekonwertowanego pliku HTML, takich jak lista indeksów stron, liczba stron, numer strony początkowej, poziom powiększenia i tak dalej.
W poprzednim artykule opracowaliśmy funkcję konwersji programu Excel do formatu PDF w języku C#. Jeśli chcesz dowiedzieć się więcej na ten temat, możesz przeczytać post na jak przekonwertować Excela na PDF w C#.