C# を使用して PDF を HTML としてレンダリングする方法

場合によっては、PDF コンテンツを Web 上で利用できるようにしたり、Web アプリケーションに統合したりする必要があります。 PDF (Portable Document Format) ファイルを HTML (Hypertext Markup Language) に変換する必要があります。 HTML は、Web ブラウザでのコンテンツ表示の標準として使用される言語であるため、PDF をオンラインで表示するための柔軟なオプションです。この包括的な記事では、C# を使用して PDF を HTML としてレンダリングする方法を説明します。以下に、C# を使用して PDF からリソースが埋め込まれた HTML を作成するための重要な手順とコード例を示します

C# を使用して PDF を HTML としてレンダリングする手順

  1. PDF を HTML としてレンダリングするために、NuGet パッケージ マネージャーを使用して GroupDocs.Viewer for .NET をインストールします
  2. PDF から HTML への変換のために、GroupDocs.Viewer 参照をプロジェクトに追加します。
  3. 入力 PDF ファイルのパスを引数としてコンストラクターに渡して、Viewer クラスのオブジェクトを作成します
  4. HtmlViewOptions.ForEmbeddedResources メソッドを呼び出して表示オプションを取得します。
  5. PDF ファイルを HTML としてレンダリングするには、表示オプションを指定して Viewer.View メソッドを呼び出します。

すべてのオンライン ブラウザは HTML を受け入れるため、追加のソフトウェアを必要とせずに多くの視聴者がコンテンツにアクセスできます。このチュートリアルで使用されるビューア ライブラリは、さまざまなプラットフォームで問題なく機能するように構築されています。システムに .NET がインストールされている場合は、Windows、macOS、Linux などの広く使用されているオペレーティング システムで上記の手順に簡単に従うことで、何の問題もなく C# を使用して PDF から HTML をレンダリングできます。以下のコード例は、レンダリング プロセスを示しています。

C# を使用して PDF を HTML としてレンダリングするコード

このチュートリアルで共有される手順に従って、C# で PDF を HTML に適切に変換するために必要な知識と能力を習得しました。この機能により、幅広いデバイスやブラウザとの互換性を確保しながら、PDF コンテンツのアクセシビリティと使いやすさが向上します。推奨ライブラリを適切に構成し、ファイル パスに重要な調整を行った後は、レンダリング コードをプロジェクトに組み込むことが簡単で問題のないプロセスになります。

前のトピックで、C# で DOCX を JPG にレンダリングする方法について詳しく説明しました。さらにサポートが必要な場合は、C# を使用して DOCX を JPG としてレンダリングする の方法に関する投稿を読むことをお勧めします。

 日本語