Как да конвертирате Word документ в HTML с помощта на C#

Тази публикация ще ви покаже как да конвертирате документ на Word в HTML с помощта на C#. Ще се концентрираме върху разработването на ръководство стъпка по стъпка заедно с примерен код за генериране на HTML от DOCX с помощта на C#. Това преобразуване на документа във формат HTML може да се извърши без необходимост от софтуер на трета страна на всяка операционна система, включително MS Windows, Linux и macOS.

Стъпки за конвертиране на Word документ в HTML с помощта на C#

  1. Инсталирайте GroupDocs.Conversion for .NET от мениджъра на пакети NuGet
  2. Добавете препратка към пространството от имена GroupDocs.Conversion
  3. Създайте екземпляр на класа Converter и заредете изходния Word файл
  4. Инициализирайте клас MarkupConvertOptions за дефиниране на атрибути за конвертирания документ
  5. Извикване на клас Converter Convert method, подаване на преобразуваното име на файл и екземпляр на класа MarkupConvertOptions

Както можете да видите, процесът за разработване на възможността за конвертиране на Word в HTML C# е доста лесен. За да започнете, изтеглете и инсталирайте подходящия пакет от NuGet, след което го посочете в кода. След това, за трансформация на документ, създайте екземпляр на класовете Converter и MarkupConvertOptions и използвайте метода Convert.

Код за конвертиране на Word документ в HTML с помощта на C#

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertWordDocumentToHtmlUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert Word Document to HTML using C#
{
// Remove the watermark in output HTML file by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source Word file for conversion to HTML
var converter = new GroupDocs.Conversion.Converter("sample.docx");
// Set the convert options for HTML file
var convertOptions = new MarkupConvertOptions();
// Convert and save the DOCX in HTML format
converter.Convert("converted.html", convertOptions);
Console.WriteLine("Done");
}
}
}

Написахме примерен код, за да покажем как да използвате функцията C# DOCX към HTML за конвертиране на документи. Обърнато е внимание на основната трансформация на документ и генерирането на HTML от документ на Word. Можете също така да използвате този код, за да подобрите атрибутите на конвертирания HTML файл, като например списък с индекси на страници, брой страници, номер на начална страница, ниво на мащабиране и т.н.

Разработихме функцията за конвертиране на Excel в PDF в C# в предишната ни статия. Ако искате да научите повече за това, можете да прочетете публикацията на как да конвертирате Excel в PDF в C#.

 Български