Extrahujte text z TXT pomocí C#

Extrahování textu ze souborů TXT je běžným požadavkem mnoha vývojářů pracujících se zpracováním dat a manipulací s textem. Soubory TXT se díky své jednoduchosti a široké kompatibilitě často používají pro ukládání dat ve formátu prostého textu. V tomto článku prozkoumáme, jak extrahovat text z TXT pomocí C#. Tento proces zahrnuje nastavení potřebného prostředí, využití knihovny Parser a implementaci jednoduchého řešení kódu. Pochopení této techniky umožní vývojářům efektivně zpracovávat textová data v jejich aplikacích C#. Níže jsou uvedeny hlavní kroky pro extrakce textu z TXT v C#.

Kroky k extrahování textu z TXT pomocí C#

  1. Přidejte do svého projektu knihovnu GroupDocs.Parser for .NET a povolte extrakci textu ze souborů TXT
  2. Inicializujte objekt Parser předáním cesty k vašemu TXT souboru v jeho konstruktoru
  3. Pomocí metody GetText na objektu Parser získáte objekt TextReader
  4. Zavolejte metodu ReadToEnd na TextReader, abyste přečetli veškerý text ze souboru TXT

Chcete-li efektivně provádět extrakci textu TXT v C#, musíte zajistit, aby vaše vývojové prostředí bylo správně nastaveno. Začněte integrací knihovny Parser do svého projektu, protože zjednodušuje proces zpracování a extrahování textu ze souborů TXT. Po nastavení knihovny vytvořte instanci třídy Parser a zadejte cestu k souboru TXT. To vám umožní využít metodu GetText, která načte objekt TextReader. Pomocí aplikace TextReader pak můžete zavolat metodu ReadToEnd a extrahovat a číst celý obsah vašeho TXT souboru. Tento přístup zajišťuje, že můžete efektivně spravovat a zpracovávat textová data pro různé aplikace.

Kód pro extrahování textu z TXT pomocí C#

using GroupDocs.Parser;
using GroupDocs.Parser.Options;
using System;
using System.IO;
namespace ExtractTextfromTXTusingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Parser library
License lic = new License();
lic.SetLicense(@"GroupDocs.Parser.lic");
// Instantiate the Parser class
using (Parser parser = new Parser("input.txt"))
{
// Retrieve formatted text into the reader
using (TextReader reader = parser.GetText())
{
// Output the formatted text from the document
// If formatted text extraction is not supported,
// the reader will be null
Console.WriteLine(reader == null ?
"Formatted text extraction isn't supported"
: reader.ReadToEnd());
Console.ReadLine();
}
}
}
}
}

Závěrem lze říci, že C# čtení textu z TXT je přímočarý proces, který může výrazně zlepšit vaše možnosti zpracování dat. Jakmile nainstalujete navrhovanou knihovnu a nastavíte příslušné cesty k souborům, bude začlenění daného kódu do vašich projektů snadné. Tento proces funguje hladce na systémech Windows, macOS a Linux a kromě .NET nebudete potřebovat žádný další software. Gratulujeme k zvládnutí extrakce textu ze souborů TXT pomocí C#! Vaše nové dovednosti rozšíří vaši schopnost efektivně pracovat s textovými daty.

Dříve jsme sdíleli podrobný návod, jak extrahovat text ze souborů EPUB pomocí C#. Chcete-li získat podrobnější informace, podívejte se na náš úplný návod, jak extrahovat text z EPUB pomocí C#.

 Čeština