JavaでWord文書をテキストに変換する方法

このハウツー記事では、Word 文書を Java でテキストに変換するための段階的な手順に焦点を当てます。 TXT 形式に変換するために、DOC または DOCX ドキュメントの両方を提供できます。さらに、このガイドでは、変換を実行するための環境を構成するための情報と、Java DOCX から TXT へのコンバーター アプリケーションのサンプル作業コードを提供します。

Java で Word 文書をテキストに変換する手順

  1. Java プロジェクトの Maven リポジトリから GroupDocs.Conversion for Java をインストールして、Word から TXT への変換機能を実装します
  2. Word から Text 形式へのドキュメント変換を実行するために不可欠なクラスをインポートする
  3. テキスト ドキュメントに変換する入力 Word ファイルを読み込むための Converter クラスのオブジェクトを作成します。
  4. 変換されたテキスト ファイルをカスタマイズするためのパラメーターを定義するために、WordProcessingConvertOptions クラスを初期化します。
  5. 最後に、Convert メソッドを呼び出して、Word をテキスト ファイルとしてディスクに保存します。

上記のポイントは、Java を使用して Word をテキストに変換する方法を明確に説明しています。 Maven リポジトリーからライブラリーをインストールし、必須クラスをインポートした後で Converter クラスを初期化することにより、入力 Word ファイルのロードを開始できます。次のステップでは、WordProcessingConvertOption を使用して、変換されたテキスト ファイルをカスタマイズするための変換オプションを定義するのに役立ちます。最後のステップでは、指定した形式に変換して、結果のファイルをディスクに保存できます。

Java で Word 文書をテキストに変換するコード

前のセクションで説明した段階的なプロセスに従って、Java Word から TXT へのコンバーター アプリケーションを開発しました。ドキュメント変換ライブラリのいくつかの単純な API 呼び出しを使用し、ドキュメント変換を実行するための数行のコードを記述しました。さらに、WordProcessingConvertOption オブジェクトを使用していくつかのプロパティを定義することにより、変換されたファイルをカスタマイズしました。さらに、特定のニーズに応じてこのサンプル コードを拡張し、Windows、macOS、Linux などの一般的なオペレーティング システムで実行することもできます。

Java を使用して Word 文書をテキストに変換する方法の詳細な手順について説明し、そのサンプル コードを作成しました。最近、Java を使用して HTML を RTF に変換する記事を公開しました。詳細については、JavaでHTMLをRTFに変換する方法 の投稿をご覧ください。

 日本語