Java を使用して HTML をテキストに変換する方法

このクイック チュートリアルでは、Java を使用して HTMLText に変換する詳細な手順と、Java HTML からプレーン テキストへの機能の実装を示すサンプル コードを提供します。このガイドでは、ドキュメント変換を実行するための最高のドキュメント コンバーター ライブラリの 1 つを使用しており、MS Windows、Linux、および Mac OS を含む任意のオペレーティング システムにインストールできます。 HTML を Java でテキストとして保存する手順とサンプル コードを次に示します。

Java を使用して HTML をテキストに変換する手順

  1. HTML to Text 機能を実装するために、Maven リポジトリから GroupDocs.Conversion for Java をセットアップします。
  2. HTML からテキストへのドキュメント変換を実行するための重要なクラスをインポートする
  3. Converter クラスをインスタンス化し、ソース HTML ファイルをそのコンストラクターに渡します
  4. WordProcessingConvertOptions クラスを初期化し、出力テキスト ファイルをカスタマイズするためのパラメータを定義します
  5. 最後に、Converter クラスの Convert メソッドを呼び出し、結果の TXT ファイル パスを WordProcessingConvertOptions オブジェクトと共に渡します。

Java で HTML をテキストに変換する機能を作成するには、上記のポイントを順番に実行します。まず、必要なライブラリをインストールし、必須クラスをインポートします。次に、変換する HTML ドキュメントをロードし、変換されたテキスト ドキュメントをカスタマイズするためのパラメータを定義します。最後に、Convert メソッドを使用すると、結果のファイルをディスクに保存できます。

Java を使用して HTML をテキストに変換するコード

このコード スニペットは、HTML をプレーン テキスト Java に変換する機能の実装を示すために開発されました。ソース ファイルを必要な形式に変換するために、ドキュメント コンバーター ライブラリのいくつかの API 呼び出しを使用しました。さらに、ドキュメント変換を行うために他のサードパーティ製ソフトウェアは必要ありません。さらに、さまざまなドキュメントを DOCX、CSV、DOT、DWG、EML、MD などの TXT 形式に変換する手順は非常に簡単です。

HTML を Java でテキストに変更するためのドキュメント変換を実行するための詳細な手順について説明しました。最近、Java での PDF から CSV への変換に関する記事を公開しました。詳細については、Javaを使用してPDFをCSVに変換する方法 の投稿をご覧ください。

 日本語