ドキュメント内の特定の単語を見つけることは、多くのアプリケーション、特に大量のデータやドキュメント コレクションを管理するアプリケーションにとって重要な機能です。フルテキスト検索は、ユーザーが複数のファイル タイプにわたって関連情報をすばやく見つけるのに役立ちます。これは、効果的なドキュメント管理システム、法的処理、および高速なデータ取得を必要とするアプリケーションにとって重要です。Java を使用すると、PDF、DOCX ファイル、テキスト ファイルなど、さまざまな種類のドキュメント内で特定の単語を検索できるフルテキスト検索機能を簡単に実装できます。この記事では、Java を使用してドキュメント内の特定の単語を検索する 方法について説明します。このガイドに従うことで、Java 環境でキーワードを効果的にインデックス付けして検索するソリューションを構築できるようになり、検索の精度とシステム効率の両方が向上します。Java での全文検索の実装 の主な手順を確認しましょう。
Javaを使用してドキュメント内の特定の単語を検索する手順
- GroupDocs.Search for Java を使用して開発環境を設定し、Java で全文検索機能を有効にします。
- Index オブジェクトを初期化して、ドキュメントの検索可能なストレージ領域を作成します。
- Index.addメソッドを使用して、特定のフォルダからドキュメントをインデックスに追加します。
- 目的のキーワードで Index.search メソッドを呼び出して、インデックスされたドキュメント内で一致するものを検索します。
- SearchResultを利用して、一致する文書を詳細な発生情報とともに取得して表示します。
特定の単語を検索するには、まずドキュメントの内容を整理して保存するインデックスを作成します。Index
クラスを使用すると、指定したフォルダーからドキュメントを追加して検索可能にすることができます。Search
メソッドを使用すると、インデックスが作成されたファイル内の任意の単語を検索でき、SearchResult
クラスは検索キーワードを含むドキュメントに関する情報を提供します。このアプローチは複数のプラットフォームで機能します。GroupDocs.Search for Java は Windows、Linux、および macOS と互換性があります。この柔軟性により、アプリケーションの環境に関係なく、次の ドキュメント内のテキストを検索する Java コード を効果的に適用できます。
Java を使用してドキュメント内の特定の単語を検索するコード
import com.groupdocs.search.Index; | |
import com.groupdocs.search.licenses.License; | |
import com.groupdocs.search.results.SearchResult; | |
public class SearchSpecificWordinDocumentsusingJava { | |
public static void main(String[] args) throws Throwable { | |
// Apply the license to remove the restrictions | |
// imposed by the Search library | |
License license = new License(); | |
license.setLicense("GroupDocs.Search.lic"); | |
// The path where the index will be stored | |
String indexFolder = "d:\\MyIndex\\"; | |
// The folder containing the documents you want to search | |
String documentsFolder = "d:\\MyDocuments\\"; | |
// The word or phrase you want to search for within the documents | |
String searchTerm = "Lorem"; | |
// Creating index in the specified folder | |
Index index = new Index(indexFolder); | |
// Indexing documents from the specified folder | |
index.add(documentsFolder); | |
// Searches for the specific word within the indexed documents | |
SearchResult result = index.search(searchTerm); | |
System.out.println("Documents: " + result.getDocumentCount()); | |
System.out.println("Occurrences: " + result.getOccurrenceCount()); | |
} | |
} |
要約すると、この方法は、Java アプリケーションにスムーズに追加できる貴重な機能です。PDF、Word ドキュメント、その他のファイル タイプを扱う場合でも、このアプローチにより、ユーザーは大規模なドキュメント コレクション内の関連情報をすばやく見つけられるため、アプリケーションの機能が大幅に向上します。このガイドでは、Java を使用してドキュメント内の単語を検索 し、この検索機能を実装して、ドキュメントの管理と取得のための強力でスケーラブルなシステムを開発するためのリソースが手に入ります。プロジェクトがエンタープライズ アプリケーション、コンテンツ管理システム、基本的なドキュメント検索ツールのいずれであっても、フルテキスト検索機能を追加すると、アプリケーションの効率と使いやすさの両方が向上します。
以前、Java を使用して DOC ファイルからバーコードをスキャンするガイドを共有しました。包括的なステップバイステップのチュートリアルについては、Javaを使用してDOCからバーコードをスキャンする の完全なガイドを必ずご覧ください。