C# を使用して Word 文書を HTML に変換する方法

この投稿では、C# を使用して Word 文書を HTML に変換する方法を紹介します。 C# を使用して DOCX から HTML を生成するためのサンプル コードとともに、ステップバイステップ ガイドの開発に専念します。このドキュメントの HTML 形式への変換は、MS Windows、Linux、macOS などのオペレーティング システム上でサードパーティ ソフトウェアを必要とせずに実行できます。

C# を使用して Word 文書を HTML に変換する手順

  1. NuGet パッケージ マネージャーから GroupDocs.Conversion for .NET をインストールします
  2. GroupDocs.Conversion 名前空間への参照を追加します
  3. Converter クラスのインスタンスを作成し、ソース Word ファイルを読み込みます
  4. 変換されたドキュメントの属性を定義するために MarkupConvertOptions クラスを初期化します
  5. Converter クラスの Convert メソッドを呼び出し、変換されたファイル名と MarkupConvertOptions クラスのインスタンスを渡します。

ご覧のとおり、Word から HTML C# への変換 機能を開発するプロセスはかなり単純です。まず、NuGet から適切なパッケージをダウンロードしてインストールし、それをコードで参照します。次に、ドキュメントを変換するために、Converter クラスと MarkupConvertOptions クラスのインスタンスを作成し、Convert メソッドを利用します。

C# を使用して Word ドキュメントを HTML に変換するコード

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertWordDocumentToHtmlUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert Word Document to HTML using C#
{
// Remove the watermark in output HTML file by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source Word file for conversion to HTML
var converter = new GroupDocs.Conversion.Converter("sample.docx");
// Set the convert options for HTML file
var convertOptions = new MarkupConvertOptions();
// Convert and save the DOCX in HTML format
converter.Convert("converted.html", convertOptions);
Console.WriteLine("Done");
}
}
}

C# DOCX to HTML 機能を使用してドキュメントを変換する方法を示すサンプル コードをいくつか作成しました。 Word 文書からの基本的な文書変換と HTML 生成に対処しました。このコードを使用して、ページ インデックスのリスト、ページ数、開始ページ番号、ズーム レベルなど、変換された HTML ファイルの属性を強化することもできます。

前回の記事で、C# で Excel を PDF に変換する機能を開発しました。詳細については、C#でExcelをPDFに変換する方法 の投稿をご覧ください。

 日本語