Jak przekonwertować dokument Worda na HTML za pomocą C#

Ten post pokaże Ci, jak konwertować dokument programu Word na format HTML przy użyciu języka C#. Skoncentrujemy się na opracowaniu przewodnika krok po kroku wraz z przykładowym kodem do generowania HTML z DOCX przy użyciu C#. Ta konwersja dokumentu do formatu HTML może zostać przeprowadzona bez oprogramowania innych firm na dowolnym systemie operacyjnym, w tym MS Windows, Linux i macOS.

Kroki, aby przekonwertować dokument programu Word na format HTML przy użyciu języka C#

  1. Zainstaluj GroupDocs.Conversion for .NET z menedżera pakietów NuGet
  2. Dodaj odwołanie do przestrzeni nazw GroupDocs.Conversion
  3. Utwórz instancję klasy Converter i załaduj źródłowy plik Word
  4. Zainicjuj klasę MarkupConvertOptions do definiowania atrybutów konwertowanego dokumentu
  5. Wywołaj metodę Converter klasy Convert, przekaż przekonwertowaną nazwę pliku i instancję klasy MarkupConvertOptions

Jak widać, proces rozwijania funkcji convert Word to HTML C# jest dość prosty. Aby rozpocząć, pobierz i zainstaluj odpowiedni pakiet z NuGet, a następnie odwołaj się do niego w kodzie. Następnie w celu przekształcenia dokumentu utwórz instancję klas Converter i MarkupConvertOptions i użyj metody Convert.

Kod do konwersji dokumentu programu Word na HTML przy użyciu języka C#

Napisaliśmy przykładowy kod, aby pokazać, jak używać funkcji C# DOCX do HTML do konwertowania dokumentów. Zajęto się podstawową transformacją dokumentu i generowaniem kodu HTML z dokumentu programu Word. Możesz także użyć tego kodu do ulepszenia atrybutów przekonwertowanego pliku HTML, takich jak lista indeksów stron, liczba stron, numer strony początkowej, poziom powiększenia i tak dalej.

W poprzednim artykule opracowaliśmy funkcję konwersji programu Excel do formatu PDF w języku C#. Jeśli chcesz dowiedzieć się więcej na ten temat, możesz przeczytać post na jak przekonwertować Excela na PDF w C#.

 Polski