Как визуализировать DOCX как HTML с помощью C#

Часто бывает необходимо визуализировать документы Microsoft Word (DOCX) в формате HTML в сферах обработки документов и создания веб-контента. Независимо от того, являетесь ли вы веб-разработчиком, создателем контента или просто хотите публиковать документы Word в Интернете, преобразование документов Word в формате HTML может оказаться ценным навыком. В этой подробной статье вы познакомитесь с процессом рендеринга DOCX как HTML с помощью C#. Ниже приведены необходимые шаги для создания HTML со встроенными ресурсами из DOCX с использованием C# вместе с примером кода.

Действия по рендерингу DOCX в виде HTML с использованием C#

  1. Используйте диспетчер пакетов NuGet для установки GroupDocs.Viewer for .NET, чтобы отобразить документ Word в формате HTML.
  2. Добавьте ссылку на пространство имен GroupDocs.Viewer в свой проект.
  3. Создайте экземпляр класса Viewer, передав путь к файлу DOCX в качестве аргумента его конструктору.
  4. Получите параметры просмотра, используя метод HtmlViewOptions.ForEmbeddedResources.
  5. Вызовите метод Viewer.View с HtmlViewOptions для отображения файла DOCX в формате HTML.

Библиотека, используемая в этом руководстве, создана для безупречной работы на различных платформах. Знание того, как создать HTML из DOCX с использованием C#, будет полезно независимо от того, работаете ли вы над проектом или вам необходимо распространять документы на множество платформ. Если у вас установлен .NET, вы можете легко следовать предоставленным инструкциям в часто используемых операционных системах, таких как Windows, macOS и Linux, чтобы без каких-либо затруднений преобразовать документ Word в HTML. Реализация процесса рендеринга продемонстрирована в примере кода, приведенном ниже.

Код для рендеринга DOCX как HTML с использованием C#

using GroupDocs.Viewer;
using GroupDocs.Viewer.Options;
namespace RenderDOCXasHTMLUsingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Viewer library
License lic = new License();
lic.SetLicense(@"GroupDocs.Viewer.lic");
// Load the input DOCX
using (var viewer = new Viewer("input.docx"))
{
// Create an HTML file for each document page.
// {0} is replaced with the current page number in the file name.
var viewOptions = HtmlViewOptions.ForEmbeddedResources("page_{0}.html");
viewer.View(viewOptions);
}
}
}
}

Благодаря информации, которую вы узнали из этой статьи, вы можете с уверенностью конвертировать DOCX в HTML на C#. Приведенный выше код краток: для легкого рендеринга документа требуется всего несколько вызовов API. После того, как вы грамотно настроите предлагаемую библиотеку и внесете необходимые изменения в пути к файлам, интеграция этого кода рендеринга Word в HTML в ваши проекты станет простой и легкой задачей.

В предыдущей статье мы рассмотрели этапы преобразования DOCX в PDF с помощью Node.js. Если вам требуются дополнительные рекомендации, мы предлагаем ознакомиться с нашим подробным руководством о том, как конвертировать DOCX в PDF с помощью Node.js

 Русский