Suche nach Sonderzeichen in Dokumenten mit C#

In diesem Artikel erhalten Sie eine Schritt-für-Schritt-Anleitung zum Suchen nach Sonderzeichen in Dokumenten mit C#. Sie können damit Textsuchen durchführen, die Symbole wie &, -, (, ), und andere nicht alphanumerische Zeichen enthalten. Diese Art der Suche ist besonders nützlich, wenn Sie mit Dokumenten arbeiten, die komplexe Daten wie Produktnamen, Codes oder Metadaten enthalten. Mit der Suchbibliothek in C# können Sie Textsuchen mit Sonderzeichen effektiv durchführen. Die Flexibilität der APIs macht sie zur idealen Wahl für die Durchführung präziser und effizienter Dokumentsuchen, die Sonderzeichen enthalten. Mit den folgenden Schritten können Sie problemlos Textsuchen mit Sonderzeichen in C# durchführen.

Schritte zum Suchen nach Sonderzeichen in Dokumenten mit C#

  1. Richten Sie Ihre Entwicklungsumgebung ein, indem Sie die Bibliothek GroupDocs.Search for .NET in Ihr Projekt integrieren und die Suche nach Sonderzeichen ermöglichen
  2. Erstellen Sie ein Index-Objekt, um Dokumente aus dem angegebenen Ordner zu indizieren
  3. Legen Sie Zeichentypen mithilfe der Methode Dictionaries.Alphabet.SetRange fest
  4. Verwenden Sie die Methode Index.Add, um Dokumente aus dem angegebenen Ordner zum Index hinzuzufügen, wo sie gespeichert und für eine einfache Durchsuchbarkeit organisiert werden.
  5. Führen Sie die Methode Index.Search aus, indem Sie eine Suchanfrage eingeben
  6. Überprüfen Sie die Suchergebnisse mithilfe des SearchResult-Objekts, das alle Informationen zu den Dokumenten enthält, die Ihren Suchkriterien entsprechen.

Um in C# nach Sonderzeichen in Dokumenten zu suchen, müssen Sie zunächst einen Index in dem angegebenen Ordner erstellen, in dem Ihre Dokumente gespeichert sind. Das Festlegen von Zeichentypen ist ebenfalls wichtig. Zur Feinabstimmung des Indizierungsprozesses können verschiedene Zeichentypen wie Buchstaben und Trennzeichen wie &, - usw. definiert werden. Verwenden Sie die Methode Add, um Dokumente aus einem bestimmten Ordner in den Index aufzunehmen. Sie können eine Suchanfrage formulieren, die Sonderzeichen enthält. Wenn Sie beispielsweise nach Rock&Roll-Musik suchen, müssen Sie Trennzeichen durch Leerzeichen ersetzen, damit die Suchmaschine sie richtig interpretiert. Mit einem StringBuilder werden Sonderzeichen richtig ersetzt und maskiert. Verwenden Sie die Methode Search, um Dokumente zu finden, die den Suchkriterien entsprechen. Dadurch kann die Suchmaschine Text mit Sonderzeichen problemlos verarbeiten.

Code zum Suchen nach Sonderzeichen in Dokumenten mit C#

using GroupDocs.Search;
using GroupDocs.Search.Dictionaries;
using GroupDocs.Search.Results;
using System.Text;
namespace SearchSpecialCharactersinDocumentsUsingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Apply the license to remove the restrictions
// imposed by the Search library
License lic = new License();
lic.SetLicense(@"GroupDocs.Search.lic");
string indexFolder = @"d:\MyIndex\";
string documentsFolder = @"d:\MyDocuments\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Setting character types
index.Dictionaries.Alphabet.SetRange(
new char[] { '&' }, CharacterType.Letter);
index.Dictionaries.Alphabet.SetRange(
new char[] { '-' }, CharacterType.Separator);
// Indexing documents from the specified folder
index.Add(documentsFolder);
// Defining a search query
string word = "rock&roll-music";
// Replacing separators with the space characters
StringBuilder result = new StringBuilder();
for (int i = 0; i < word.Length; i++)
{
char character = word[i];
CharacterType characterType = index.Dictionaries.Alphabet.GetCharacterType(character);
if (characterType == CharacterType.Separator)
{
result.Append(' ');
}
else
{
result.Append(character);
}
}
// Escaping special characters
const string specialCharacters = "():\"&|!^~*?\\";
for (int i = result.Length - 1; i >= 0; i--)
{
char c = result[i];
if (specialCharacters.Contains(c.ToString()))
{
result.Insert(i, '\\');
}
}
string query = result.ToString();
if (query.Contains(" "))
{
query = "\"" + query + "\"";
}
SearchResult searchResult = index.Search(query);
}
}
}

Sie können Text mit Sonderzeichen in C# plattformübergreifend suchen. Diese Flexibilität ermöglicht es Ihnen, Suchvorgänge in einer Vielzahl von Formaten und Dokumenttypen durchzuführen und so die plattformübergreifende Kompatibilität sicherzustellen. Egal, ob Sie Windows, Linux oder macOS verwenden, Sie können sich auf konsistente und genaue Ergebnisse verlassen. Durch den richtigen Umgang mit Sonderzeichen können Sie robuste Dokumentsuchen durchführen, die den unterschiedlichsten Geschäftsanforderungen gerecht werden. Diese Funktion stellt sicher, dass Ihre Anwendungen anpassungsfähig und reaktionsfähig bleiben und genaue Ergebnisse liefern, unabhängig davon, wo sie bereitgestellt werden.

Zuvor haben wir eine umfassende Anleitung zur Suche nach verschiedenen Wortformen mit C# veröffentlicht. Vollständige Schritt-für-Schritt-Anleitungen finden Sie in unserem ausführlichen Artikel zur Suche nach verschiedenen Wortformen mit C#.

 Deutsch