Node.js を使用して PDF を HTML に変換する

追加のプラグインを必要とせずにドキュメントを Web サイトに表示するには、PDF を Web 対応形式に変換することが不可欠です。シンプルかつ強力なアプローチを活用することで、Node.js を使用して PDF を HTML に効率的に変換できます。この方法によりシームレスなドキュメント変換が可能になり、どのブラウザからでもコンテンツに簡単にアクセスできるようになります。構造化データの抽出、ドキュメントの書式設定の保持、または Web ベースのドキュメント表示の有効化が必要な場合でも、このソリューションによりスムーズな変換プロセスが保証されます。わずか数行のコードで変換を自動化し、Node.js で PDF を HTML に簡単にエクスポートできます。

Node.js を使用して PDF を HTML に変換する手順

  1. プロジェクトで PDF から HTML への変換をサポートするには、Java 経由の Node.js の GroupDocs.Conversion をインストールして構成します
  2. 必要なモジュールをアプリケーションに追加して、さまざまなファイル形式の変換を効率的に処理します。
  3. Converter クラスのインスタンスを作成し、PDF ファイルのパスを指定してドキュメントをロードします
  4. MarkupConvertOptions を定義し、HTML を目的の出力形式として設定します。
  5. Converter クラスの Convert メソッドを実行して PDF を処理し、HTML ファイルを生成します。

この変換を実現するために、高品質の出力をサポートする堅牢なファイル変換ライブラリを利用します。まず、必要なモジュールがインポートされ、ライセンスが適用されてすべての機能が有効になります。次に、PDF ファイルをロードするために Converter クラスのインスタンスが作成され、出力形式が HTML として構成されます。変換プロセスでは、HTML、画像、書式設定などの元のドキュメント構造がそのまま維持されることが保証されます。この方法は、動的なコンテンツのレンダリングを必要とする Web アプリケーションに特に役立ちます。最小限のコーディング作業で、Node.js で PDF から HTML を生成し、それをワークフローに統合してシームレスなドキュメント管理を行うことができます。

Node.js を使用して PDF を HTML に変換するコード

const conversion = require('@groupdocs/groupdocs.conversion')
const licensePath = "GroupDocs.Search.lic";
const license = new conversion.License()
license.setLicense(licensePath);
// Load the input PDF file
const converter = new conversion.Converter("sample.pdf");
const options = new conversion.MarkupConvertOptions();
options.setFormat(conversion.MarkupFileType.Html);
// Save output HTML to disk
converter.convert("output.html", options);
process.exit(0);

PDF を HTML 形式に変換すると、Web ベースのドキュメントの共有と埋め込みにさまざまな可能性が広がります。このソリューションは、ドキュメントの構造を変更せずにオンラインで公開する必要がある企業、開発者、コンテンツ作成者に最適です。このプロセスを自動化することで、アクセシビリティを強化し、ユーザー エクスペリエンスを向上させることができます。デジタル アーカイブ、Web パブリッシング、コンテンツ管理システムのいずれの場合でも、Node.js を使用して PDF を HTML に変更 できる機能により、高品質の出力を確保しながらドキュメント処理が簡素化されます。

以前、Node.js を使用して PDF をテキストに変換するための包括的なガイドを共有しました。詳細な段階的なプロセスについては、Node.jsを使用してPDFをテキストに変換する の方法に関する完全なチュートリアルをご覧ください。

 日本語