このハウツー記事では、Java を使用して PowerPoint からテキストを抽出するための段階的な手順と、これらの手順を {{HYPERLINK1 からテキストを抽出するためのアプリケーションの開発に反映させる方法 に焦点を当てます。 }} Javaで。さらに、ドキュメント データ抽出ライブラリのいくつかの単純な API 呼び出しを使用して、ドキュメントからテキストを抽出します。 Java で PowerPoint からテキストを抽出するための主要な手順とサンプル コードを次に示します。
Java を使用して PowerPoint からテキストを抽出する手順
- Java プロジェクトの Maven リポジトリから GroupDocs.Parser for Java をセットアップして、PowerPoint ドキュメントからテキストを抽出します
- PowerPoint ファイルからテキストを抽出する機能を開発するために不可欠なクラスをインポートする
- 入力 PowerPoint ドキュメントを読み込んでそこからテキストを抽出するための Parser クラスのインスタンスを作成します
- TextReader オブジェクトを取得するために getText メソッドを呼び出します
- 最後に、リーダーからテキストを読み取り、印刷します
Java を使用して PPT からテキストを抽出するために必要なすべてのポイントをリストしました。これらの手順は、PowerPoint ファイルからテキストを取得するために従うのが簡単で、Windows、Linux、macOS などの一般的なオペレーティング システムで使用できます。さらに、これらの手順では、機能を実装するために追加のソフトウェアをセットアップする必要はありません。
Java を使用して PowerPoint からテキストを抽出するコード
上記のコード スニペットでは、get Text from PowerPoint Java アプリケーションを開発して、機能の実装を示しています。 PPT ファイルからテキストを抽出するには、必要なライブラリを設定してから、必要なクラスを含める必要があります。その後、Parser クラスを初期化して入力 PPTX ファイルを読み込み、getText メソッドを使用して TextReader コレクションを取得します。最後に、リーダーからテキストを読み取ってテキストを印刷する必要があります。
Java の PowerPoint からテキストを取得する機能を開発する方法の詳細なプロセスについて説明し、そのサンプル コードを作成しました。最近、Java を使用して HTML からテキストを抽出する記事を公開しました。詳細については、JavaでHTMLからテキストを抽出する方法 ガイドをご覧ください。