Тази публикация ще ви покаже как да конвертирате документ на Word в HTML с помощта на C#. Ще се концентрираме върху разработването на ръководство стъпка по стъпка заедно с примерен код за генериране на HTML от DOCX с помощта на C#. Това преобразуване на документа във формат HTML може да се извърши без необходимост от софтуер на трета страна на всяка операционна система, включително MS Windows, Linux и macOS.
Стъпки за конвертиране на Word документ в HTML с помощта на C#
- Инсталирайте GroupDocs.Conversion for .NET от мениджъра на пакети NuGet
- Добавете препратка към пространството от имена GroupDocs.Conversion
- Създайте екземпляр на класа Converter и заредете изходния Word файл
- Инициализирайте клас MarkupConvertOptions за дефиниране на атрибути за конвертирания документ
- Извикване на клас Converter Convert method, подаване на преобразуваното име на файл и екземпляр на класа MarkupConvertOptions
Както можете да видите, процесът за разработване на възможността за конвертиране на Word в HTML C# е доста лесен. За да започнете, изтеглете и инсталирайте подходящия пакет от NuGet, след което го посочете в кода. След това, за трансформация на документ, създайте екземпляр на класовете Converter и MarkupConvertOptions и използвайте метода Convert.
Код за конвертиране на Word документ в HTML с помощта на C#
using System; | |
using GroupDocs.Conversion.Options.Convert; | |
namespace ConvertWordDocumentToHtmlUsingCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to convert Word Document to HTML using C# | |
{ | |
// Remove the watermark in output HTML file by adding license | |
string licensePath = "GroupDocs.Conversion.lic"; | |
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License(); | |
lic.SetLicense(licensePath); | |
// Load the source Word file for conversion to HTML | |
var converter = new GroupDocs.Conversion.Converter("sample.docx"); | |
// Set the convert options for HTML file | |
var convertOptions = new MarkupConvertOptions(); | |
// Convert and save the DOCX in HTML format | |
converter.Convert("converted.html", convertOptions); | |
Console.WriteLine("Done"); | |
} | |
} | |
} |
Написахме примерен код, за да покажем как да използвате функцията C# DOCX към HTML за конвертиране на документи. Обърнато е внимание на основната трансформация на документ и генерирането на HTML от документ на Word. Можете също така да използвате този код, за да подобрите атрибутите на конвертирания HTML файл, като например списък с индекси на страници, брой страници, номер на начална страница, ниво на мащабиране и т.н.
Разработихме функцията за конвертиране на Excel в PDF в C# в предишната ни статия. Ако искате да научите повече за това, можете да прочетете публикацията на как да конвертирате Excel в PDF в C#.