Pesquisa de expressão regular usando C#

A pesquisa de expressão regular usando C# é um recurso essencial para aplicativos que precisam de recursos de correspondência de padrões precisos e avançados. Diferentemente das pesquisas básicas por palavra-chave, o regex permite que os desenvolvedores definam padrões complexos para localizar texto em documentos. Isso é particularmente benéfico em cenários como validação de formatos, identificação de estruturas repetitivas ou filtragem de dados. Ao utilizar expressões regulares, os desenvolvedores podem criar soluções de pesquisa altamente personalizáveis que se adaptam a necessidades comerciais específicas. Neste artigo, vamos nos aprofundar em como executar uma pesquisa de expressão regular em C#, mostrando sua implementação prática com exemplos de código claros.

Etapas para pesquisa de expressão regular usando C#

  1. Adicione a biblioteca GroupDocs.Search for .NET ao seu ambiente de desenvolvimento para habilitar a funcionalidade de pesquisa de expressão regular
  2. Crie uma instância da classe Index. Especifique o caminho da pasta onde o índice será armazenado para preparar uma pesquisa eficiente
  3. Adicione os documentos da pasta especificada ao índice usando o método Index.Add
  4. Construa uma consulta de string que represente a expressão regular. O acento circunflexo (^) no início da consulta indica que é uma pesquisa regex
  5. Use o método Index.Search com a consulta de expressão regular para realizar a pesquisa

Para executar uma pesquisa de documentos baseada em regex em C#, o processo começa indexando documentos para consultas eficientes. Isso envolve criar um índice onde todos os documentos são escaneados e preparados para pesquisas. Uma vez que o índice é configurado, consultas de expressão regular podem ser executadas para localizar padrões. Usando a biblioteca GroupDocs.Search, uma consulta de string pode identificar padrões como palavras começando com dois ou mais caracteres idênticos. Isso é obtido com uma consulta regex como ^^(.)\\1{1,}. Como alternativa, uma abordagem baseada em objeto permite criar consultas regex dinâmicas programaticamente, oferecendo flexibilidade ainda maior. Esses recursos permitem que os aplicativos extraiam padrões e insights complexos de diversos tipos de documentos como PDF, Word e arquivos de texto simples.

Pesquisa de código para expressão regular usando C#

using GroupDocs.Search;
using GroupDocs.Search.Results;
namespace RegularexpressionSearchUsingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Apply the license to remove the restrictions
// imposed by the Search library
License lic = new License();
lic.SetLicense(@"GroupDocs.Search.lic");
string indexFolder = @"d:\MyIndex\";
string documentsFolder = @"d:\MyDocuments\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Indexing documents from the specified folder
index.Add(documentsFolder);
// Search for the phrase in text form
// The first caret character at the beginning indicates
// that this is a regular expression search query
string query1 = "^^(.)\\1{1,}";
// Search for two or more identical characters
// at the beginning of a word
SearchResult result1 = index.Search(query1);
// Search for the phrase in object form
// Search for two or more identical characters
// at the beginning of a word
SearchQuery query2 = SearchQuery.CreateRegexQuery("^(.)\\1{1,}");
SearchResult result2 = index.Search(query2);
}
}
}

Um dos benefícios de destaque dessa abordagem é sua independência de plataforma. Não importa se você está trabalhando no Windows, Mac ou Linux, a capacidade de pesquisar com expressões regulares em C# garante compatibilidade entre diferentes ambientes operacionais. Isso o torna uma escolha confiável para desenvolvimento multiplataforma, permitindo que os desenvolvedores criem soluções robustas que lidam com cenários de pesquisa avançados de forma eficiente. Ao integrar a funcionalidade de pesquisa baseada em regex, os aplicativos podem obter processamento de dados aprimorado e interação do usuário sob medida para uma ampla gama de requisitos.

Anteriormente, compartilhamos um guia detalhado sobre pesquisa de frases em documentos usando C#. Para acessar as instruções passo a passo completas, confira nosso artigo abrangente sobre como executar pesquisa de frases em documentos usando C#.

 Português