この記事では、段階的な手順と、Java で XML からテキストを抽出する サンプル コードを含む完全な情報を簡単に説明します。さらに、ドキュメントからテキストを抽出するために Maven リポジトリーから必要なライブラリーをセットアップする方法を学びます。テキストを抽出するために必要なすべてのポイントと、Java を使用して XML からテキストを抽出するための実際の例を以下に示します。
Java で XML からテキストを抽出する手順
- Java アプリケーションの Maven リポジトリから GroupDocs.Parser for Java をインストールして、XML ファイルからテキストを抽出します
- XML ファイルからテキストを抽出する機能を開発するために必要なクラスをインポートする
- 入力 XML ドキュメントを読み込んでそこからテキストを抽出するための Parser クラスを初期化します
- getText メソッドを呼び出して TextReader オブジェクトを取得する
- リーダーからテキストを読み取って表示する
Java で XML からテキストを取得 機能を構築するために必要なすべての要素の概要を説明しました。これらの手順は、Windows、Linux、および macOS を含む一般的なオペレーティング システムで使用でき、XML ファイルからテキストを抽出するための追加のソフトウェアに依存しません。さらに、簡単な API 呼び出しを使用して数行のコードだけで機能を完成させることができます。
Java で XML からテキストを抽出するコード
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.licensing.License; | |
import com.groupdocs.parser.data.TextReader; | |
import java.io.IOException; | |
public class ExtractTextFromXmlInJava { | |
public static void main(String[] args) throws IOException { // Main function to extract text from XML in Java | |
// Remove the watermark in output | |
License lic = new License(); | |
lic.setLicense("GroupDocs.Parser.lic"); | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.xml")) { | |
// Extract a text into the reader | |
try (TextReader reader = parser.getText()) { | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
System.out.println(reader == null ? "Text extraction isn't supported" : reader.readToEnd()); | |
} | |
} | |
} | |
} |
前述のサンプルで開発されたアプリケーションは、XML ファイルからテキストを抽出する Java アプリケーションの実装方法を示しています。最初に必要なライブラリをインストールしてから、関連するクラスを含めて、XML ファイルからテキストを抽出する必要があります。次に、Parser クラスを初期化して入力 XML ファイルを読み込み、getText メソッドを使用して TextReader オブジェクトを取得し、リーダーからテキストを読み取ります。
Java get Text from XML アプリケーションを開発する方法の詳細なプロセスについて説明し、そのサンプル コードを開発しました。最近、Java で PowerPoint からテキストを抽出する記事を公開しました。詳細については、Java を使用して PowerPoint からテキストを抽出する方法 ガイドをご覧ください。