この投稿では、C# を使用して Word 文書を HTML に変換する方法を紹介します。 C# を使用して DOCX から HTML を生成するためのサンプル コードとともに、ステップバイステップ ガイドの開発に専念します。このドキュメントの HTML 形式への変換は、MS Windows、Linux、macOS などのオペレーティング システム上でサードパーティ ソフトウェアを必要とせずに実行できます。
C# を使用して Word 文書を HTML に変換する手順
- NuGet パッケージ マネージャーから GroupDocs.Conversion for .NET をインストールします
- GroupDocs.Conversion 名前空間への参照を追加します
- Converter クラスのインスタンスを作成し、ソース Word ファイルを読み込みます
- 変換されたドキュメントの属性を定義するために MarkupConvertOptions クラスを初期化します
- Converter クラスの Convert メソッドを呼び出し、変換されたファイル名と MarkupConvertOptions クラスのインスタンスを渡します。
ご覧のとおり、Word から HTML C# への変換 機能を開発するプロセスはかなり単純です。まず、NuGet から適切なパッケージをダウンロードしてインストールし、それをコードで参照します。次に、ドキュメントを変換するために、Converter クラスと MarkupConvertOptions クラスのインスタンスを作成し、Convert メソッドを利用します。
C# を使用して Word ドキュメントを HTML に変換するコード
using System; | |
using GroupDocs.Conversion.Options.Convert; | |
namespace ConvertWordDocumentToHtmlUsingCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to convert Word Document to HTML using C# | |
{ | |
// Remove the watermark in output HTML file by adding license | |
string licensePath = "GroupDocs.Conversion.lic"; | |
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License(); | |
lic.SetLicense(licensePath); | |
// Load the source Word file for conversion to HTML | |
var converter = new GroupDocs.Conversion.Converter("sample.docx"); | |
// Set the convert options for HTML file | |
var convertOptions = new MarkupConvertOptions(); | |
// Convert and save the DOCX in HTML format | |
converter.Convert("converted.html", convertOptions); | |
Console.WriteLine("Done"); | |
} | |
} | |
} |
C# DOCX to HTML 機能を使用してドキュメントを変換する方法を示すサンプル コードをいくつか作成しました。 Word 文書からの基本的な文書変換と HTML 生成に対処しました。このコードを使用して、ページ インデックスのリスト、ページ数、開始ページ番号、ズーム レベルなど、変換された HTML ファイルの属性を強化することもできます。
前回の記事で、C# で Excel を PDF に変換する機能を開発しました。詳細については、C#でExcelをPDFに変換する方法 の投稿をご覧ください。