Wyodrębnij tekst z TXT za pomocą C#

Wyodrębnianie tekstu z plików TXT jest powszechnym wymogiem dla wielu programistów pracujących z przetwarzaniem danych i manipulacją tekstem. Pliki TXT, ze względu na swoją prostotę i szeroką kompatybilność, są często używane do przechowywania danych zwykłego tekstu. W tym artykule przyjrzymy się, jak wyodrębnić tekst z TXT za pomocą języka C#. Proces ten obejmuje skonfigurowanie niezbędnego środowiska, wykorzystanie biblioteki Parser i wdrożenie prostego rozwiązania kodu. Zrozumienie tej techniki umożliwi programistom wydajne przetwarzanie danych tekstowych w ich aplikacjach C#. Poniżej przedstawiono główne kroki wyodrębniania tekstu z TXT w języku C#.

Kroki wyodrębniania tekstu z pliku TXT za pomocą języka C#

  1. Dodaj bibliotekę GroupDocs.Parser for .NET do swojego projektu, aby umożliwić wyodrębnianie tekstu z plików TXT
  2. Zainicjuj obiekt Parser, przekazując ścieżkę do pliku TXT w jego konstruktorze
  3. Użyj metody GetText na obiekcie Parser, aby uzyskać obiekt TextReader
  4. Wywołaj metodę ReadToEnd w TextReader, aby odczytać cały tekst z pliku TXT

Aby skutecznie przeprowadzić ekstrakcję tekstu TXT w C#, musisz upewnić się, że Twoje środowisko programistyczne jest prawidłowo skonfigurowane. Zacznij od zintegrowania biblioteki Parser ze swoim projektem, ponieważ upraszcza ona proces obsługi i ekstrakcji tekstu z plików TXT. Po skonfigurowaniu biblioteki utwórz wystąpienie klasy Parser i określ ścieżkę do pliku TXT. Umożliwi Ci to wykorzystanie metody GetText, która pobiera obiekt TextReader. Za pomocą TextReader możesz następnie wywołać metodę ReadToEnd, aby wyodrębnić i odczytać całą zawartość pliku TXT. Takie podejście zapewnia, że możesz wydajnie zarządzać danymi tekstowymi i przetwarzać je dla różnych aplikacji.

Kod do wyodrębniania tekstu z TXT przy użyciu C#

using GroupDocs.Parser;
using GroupDocs.Parser.Options;
using System;
using System.IO;
namespace ExtractTextfromTXTusingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Parser library
License lic = new License();
lic.SetLicense(@"GroupDocs.Parser.lic");
// Instantiate the Parser class
using (Parser parser = new Parser("input.txt"))
{
// Retrieve formatted text into the reader
using (TextReader reader = parser.GetText())
{
// Output the formatted text from the document
// If formatted text extraction is not supported,
// the reader will be null
Console.WriteLine(reader == null ?
"Formatted text extraction isn't supported"
: reader.ReadToEnd());
Console.ReadLine();
}
}
}
}
}

Podsumowując, C# read text from TXT to prosty proces, który może znacznie zwiększyć Twoje możliwości przetwarzania danych. Po zainstalowaniu sugerowanej biblioteki i ustawieniu odpowiednich ścieżek plików, włączenie podanego kodu do Twoich projektów będzie łatwe. Ten proces działa płynnie w systemach Windows, macOS i Linux, a nie będziesz potrzebować żadnego dodatkowego oprogramowania poza .NET. Gratulacje opanowania ekstrakcji tekstu z plików TXT przy użyciu C#! Twoje nowe umiejętności poprawią Twoją zdolność do wydajnego przetwarzania danych tekstowych.

Wcześniej udostępniliśmy szczegółowy przewodnik na temat wyodrębniania tekstu z plików EPUB za pomocą języka C#. Aby uzyskać bardziej szczegółowe informacje, zapoznaj się z naszym pełnym samouczkiem na temat wyodrębnij tekst z EPUB za pomocą C#.

 Polski