Javaを使用してあいまい検索を実行する

現代のデジタル世界では、大量のドキュメントを迅速かつ正確に検索する機能は、多くのアプリケーションにとって不可欠です。ただし、従来の完全一致検索アルゴリズムは、ユーザーがタイプミスをしたり、別のスペルを使用したり、不完全なデータを入力したりすると、失敗することがよくあります。ここで、あいまい検索が非常に役立ちます。あいまい検索では、近似一致が可能なので、検索用語とコンテンツが完全に一致していなくても、ユーザーは関連する結果を見つけられます。Java を使用すると、開発者は Java を使用してあいまい検索を実行 し、高度な機能を利用して検索精度を向上させることができます。堅牢なドキュメント管理システムのために Java でファジー ロジックを使用してドキュメント検索を構築 しようとしている場合でも、基本的な検索ツールを開発している場合でも、この記事は包括的なガイドとなります。

Javaを使用してあいまい検索を実行する手順

  1. GroupDocs.Search for Java ライブラリを統合して開発環境を設定し、あいまい検索機能の実装を可能にします。
  2. Index オブジェクトを初期化して、効率的な検索のためにドキュメントを整理および準備するための保存場所を指定します。
  3. Index.add メソッドを使用して、インデックスを作成するドキュメントを含むフォルダー パスを指定して、ファイルをインデックスに追加します。
  4. 検索オプションでFuzzySearch.Enabledプロパティを設定してあいまい検索を有効にし、クエリで近似一致を許可します。
  5. FuzzySearch.FuzzyAlgorithm プロパティで類似度レベルを指定して、ファジー検索アルゴリズムを構成します。このレベルは、単語の長さに基づいて許容されるエラーの数を定義します (例: 10 ~ 14 文字の単語の場合は最大 2 つのエラー)
  6. 目的のクエリと構成されたSearchOptionsを使用してIndex.searchを使用してインデックスの検索を実行し、関連する結果を取得します。

GroupDocs.Search のあいまい検索では、検索クエリとインデックスされたコンテンツの間で近似一致を行うことができます。これは、最大 20% の不一致を許容する類似度しきい値 (0.8 など) と、単語の長さに基づいて許容エラーを調整するあいまいアルゴリズムを備えた Java のあいまい検索アルゴリズム を使用して実現されます。これを実装するには、まず開発環境を設定し、プロジェクトに必要なライブラリを追加します。ドキュメントを保持するインデックスを作成し、検索するファイルを追加します。FuzzySearch.Enabled プロパティを true に設定して検索オプションであいまい検索を有効にし、FuzzyAlgorithm プロパティを使用して類似度しきい値を構成し、許容される不一致レベルを定義します。最後に、これらの設定で検索クエリを実行すると、ライブラリは近似一致に基づいて結果を返すため、検索用語の不一致やバリエーションを処理できます。

Java を使用してあいまい検索を実行するコード

import com.groupdocs.search.Index;
import com.groupdocs.search.licenses.License;
import com.groupdocs.search.options.SearchOptions;
import com.groupdocs.search.options.SimilarityLevel;
import com.groupdocs.search.results.SearchResult;
public class PerformFuzzySearchusingJava {
public static void main(String[] args) throws Exception {
// Apply the license to remove the restrictions
// imposed by the Search library
License license = new License();
license.setLicense("GroupDocs.Search.lic");
// The path where the index will be stored
String indexFolder = "c:\\MyIndex\\";
// The folder containing the documents you want to search
String documentsFolder = "c:\\MyDocuments\\";
String query = "Einstein";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Indexing documents from the specified folder
index.add(documentsFolder);
SearchOptions options = new SearchOptions();
// Enabling the fuzzy search
options.getFuzzySearch().setEnabled(true);
// Creating the fuzzy search algorithm
options.getFuzzySearch().setFuzzyAlgorithm(new SimilarityLevel(0.8));
// This function specifies 0 as the maximum number of mistakes
// for words from 1 to 4 characters.
// It specifies 1 as the maximum number of mistakes for
// words from 5 to 9 characters.
// It specifies 2 as the maximum number of mistakes for words
// from 10 to 14 characters. And so on.
// Search in index
SearchResult result = index.search(query, options);
}
}

結論として、Java のあいまい検索を Search ライブラリと統合することは、アプリケーションの検索機能を向上させるシンプルかつ強力な方法です。この Java 開発者向けあいまい検索チュートリアル では、調整可能な設定で近似一致を処理する方法を示し、ユーザーが不完全なクエリでも関連する結果にアクセスできるようにします。Search ライブラリはプラットフォームに依存しない設計になっているため、柔軟なソリューションとなり、開発者はさまざまな環境で強力な検索機能を作成できます。ドキュメント管理システム、検索ツール、または高度な検索機能を必要とするアプリケーションを構築する場合でも、合理化されたユーザーフレンドリーなエクスペリエンスを提供するために必要なツールが提供されます。

以前、Java でファセット検索を実装するための包括的なガイドを公開しました。完全なステップバイステップのチュートリアルについては、Javaを使用してファセット検索を実行する方法 の詳細な記事を必ずご覧ください。

 日本語