ドキュメント内の特定の単語の検索は、多くのソフトウェア アプリケーション、特に大量のデータやドキュメントを処理するソフトウェア アプリケーションにとって重要な機能です。フルテキスト検索機能を使用すると、さまざまなファイル タイプから関連するコンテンツをすばやく見つけることができます。これは、効率的なドキュメント管理システム、法的文書処理、または高速な情報検索を必要とするアプリケーションにとって不可欠です。C# を使用すると、PDF、DOCX ファイル、テキスト ドキュメントなど、さまざまな種類のドキュメント内で特定の単語を検索できるフルテキスト検索機能を簡単に実装できます。この記事では、C# を使用してドキュメント内の特定の単語を検索する方法について説明します。少数のドキュメントを扱う場合でも、大規模なドキュメント リポジトリを管理する場合でも、ドキュメントをインデックス化してキーワードを検索する機能は非常に貴重です。このガイドを読み終えると、.NET 環境内でドキュメントをインデックス化し、キーワードを効率的に検索するソリューションを作成できるようになり、検索の精度と全体的なシステム パフォーマンスが向上します。C# でフルテキスト検索を実装する ための主な手順は次のとおりです。
C# を使用してドキュメント内の特定の単語を検索する手順
- GroupDocs.Search for .NET を使用して C# で全文検索を実装するように開発環境を構成します。
- Index オブジェクトを初期化して、ドキュメントの検索可能なストレージ領域を設定します。
- Index.Add メソッドを使用して、指定したフォルダのドキュメントをインデックスに含める
- キーワードを指定して Index.Search メソッドを呼び出し、インデックスされたドキュメント内の出現箇所を検索します。
- SearchResultを使用して、一致するドキュメントと発生の詳細を取得して表示します。
特定の単語を検索するには、まずドキュメントの内容を処理して保存するインデックスを作成する必要があります。Index クラスを使用すると、フォルダーからドキュメントを追加して検索可能にすることができます。Search メソッドを使用すると、インデックスが作成されたファイル全体で任意の単語を検索でき、SearchResult クラスは検索語を含むドキュメントの詳細を提供します。このメソッドはさまざまなプラットフォームに適用できます。GroupDocs.Search for .NET は、Windows、Linux、および macOS 向けの多目的ソリューションです。このプラットフォーム独立性により、アプリケーションが実行される環境に関係なく、次の C# コードを使用してドキュメント内のテキストを効率的に検索 できます。
C# を使用してドキュメント内の特定の単語を検索するコード
using GroupDocs.Search; | |
using GroupDocs.Search.Results; | |
using System; | |
namespace SearchSpecificWordinDocumentsusingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Apply the license to remove the restrictions imposed by the Search library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Search.lic"); | |
// The path where the index will be stored | |
string indexFolder = @"c:\MyIndex\"; | |
// The folder containing the documents you want to search | |
string documentsFolder = @"c:\MyDocuments\"; | |
// The word or phrase you want to search for within the documents | |
string searchTerm = "Lorem"; | |
// Creating index in the specified folder | |
Index index = new Index(indexFolder); | |
// Indexing documents from the specified folder | |
index.Add(documentsFolder); | |
// Searches for the specific word within the indexed documents | |
SearchResult result = index.Search(searchTerm); | |
Console.WriteLine(); | |
Console.WriteLine("Documents: " + result.DocumentCount); | |
Console.WriteLine("Occurrences: " + result.OccurrenceCount); | |
} | |
} | |
} |
結論として、ここで説明した方法は、.NET アプリケーションにシームレスに統合できる強力な機能です。PDF、Word ファイル、その他のドキュメントの種類を扱う場合でも、このプロセスにより、大量のドキュメント セット内の関連コンテンツをユーザーがすばやく見つけられるようになり、アプリの機能が大幅に強化されます。このガイドでは、C# を使用してドキュメント内の単語を検索する ための知識が得られ、この検索方法を適用して、堅牢でスケーラブルなドキュメント管理および検索システムを作成できます。エンタープライズ アプリケーション、コンテンツ管理システム、または単純なドキュメント検索ツールを構築する場合でも、フルテキスト検索機能を統合すると、アプリケーションの効率と使いやすさが向上します。
以前、C# を使用して ODT ファイルから画像を抽出するガイドを公開しました。詳細なステップバイステップのチュートリアルについては、C# を使用して ODT から画像を抽出する の完全ガイドを必ずご覧ください。