ドキュメント処理や Web コンテンツ生成の分野では、Microsoft Word ドキュメント (DOCX) を HTML 形式としてレンダリングする必要があることがよくあります。 Web 開発者、コンテンツ作成者、または単に Word ドキュメントをオンラインで公開したいと考えている場合でも、Word ドキュメントを HTML としてレンダリングすることは貴重なスキルとなります。この詳細な記事では、C# を使用して DOCX を HTML としてレンダリングする方法のプロセスを説明します。以下は、C# を使用して DOCX からリソースが埋め込まれた HTML を作成するために必要な手順とコード例です。
C# を使用して DOCX を HTML としてレンダリングする手順
- Word ドキュメントを HTML としてレンダリングするには、NuGet パッケージ マネージャーを使用して GroupDocs.Viewer for .NET をインストールします。
- GroupDocs.Viewer 名前空間参照をプロジェクトに追加する
- DOCX ファイルのパスを引数としてコンストラクターに渡して、Viewer クラスをインスタンス化します。
- HtmlViewOptions.ForEmbeddedResources メソッドを使用して表示オプションを取得します
- HtmlViewOptions を指定して Viewer.View メソッドを呼び出して、DOCX ファイルを HTML としてレンダリングします
このチュートリアルで使用されるライブラリは、さまざまなプラットフォームで問題なく動作するように構築されています。 C# を使用して DOCX から HTML を作成する方法を知っていると、プロジェクトに取り組んでいる場合でも、ドキュメントを多くのプラットフォームに配布する必要がある場合でも役立ちます。 .NET がインストールされている場合は、Windows、macOS、Linux などの一般的に使用されるオペレーティング システムで提供される手順に簡単に従うことで、Word ドキュメントを難なく HTML にレンダリングできます。レンダリング プロセスの実装は、以下のコード例で示されています。
C# を使用して DOCX を HTML としてレンダリングするコード
using GroupDocs.Viewer; | |
using GroupDocs.Viewer.Options; | |
namespace RenderDOCXasHTMLUsingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Set License to avoid the limitations of Viewer library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Viewer.lic"); | |
// Load the input DOCX | |
using (var viewer = new Viewer("input.docx")) | |
{ | |
// Create an HTML file for each document page. | |
// {0} is replaced with the current page number in the file name. | |
var viewOptions = HtmlViewOptions.ForEmbeddedResources("page_{0}.html"); | |
viewer.View(viewOptions); | |
} | |
} | |
} | |
} |
この記事で学んだ情報があれば、自信を持って DOCX を C# の HTML に変換できます。上記のコードは簡潔で、わずか数回の API 呼び出しだけでドキュメントのレンダリングを簡単に実現できます。推奨されるライブラリを適切に設定し、ファイル パスに必要な調整を行ったら、Word から HTML へのレンダリングのこのコードをプロジェクトに統合するのは、シンプルで手間のかからない作業になります。
前回の記事では、Node.js を使用して DOCX を PDF に変換する手順について説明しました。追加のガイダンスが必要な場合は、Node.jsを使用してDOCXをPDFに変換する の方法に関する包括的なチュートリアルを参照することをお勧めします。