Wyodrębnianie tekstu z plików TXT jest powszechnym wymogiem dla wielu programistów pracujących z przetwarzaniem danych i manipulacją tekstem. Pliki TXT, ze względu na swoją prostotę i szeroką kompatybilność, są często używane do przechowywania danych zwykłego tekstu. W tym artykule przyjrzymy się, jak wyodrębnić tekst z TXT za pomocą języka C#. Proces ten obejmuje skonfigurowanie niezbędnego środowiska, wykorzystanie biblioteki Parser i wdrożenie prostego rozwiązania kodu. Zrozumienie tej techniki umożliwi programistom wydajne przetwarzanie danych tekstowych w ich aplikacjach C#. Poniżej przedstawiono główne kroki wyodrębniania tekstu z TXT w języku C#.
Kroki wyodrębniania tekstu z pliku TXT za pomocą języka C#
- Dodaj bibliotekę GroupDocs.Parser for .NET do swojego projektu, aby umożliwić wyodrębnianie tekstu z plików TXT
- Zainicjuj obiekt Parser, przekazując ścieżkę do pliku TXT w jego konstruktorze
- Użyj metody GetText na obiekcie Parser, aby uzyskać obiekt TextReader
- Wywołaj metodę ReadToEnd w TextReader, aby odczytać cały tekst z pliku TXT
Aby skutecznie przeprowadzić ekstrakcję tekstu TXT w C#, musisz upewnić się, że Twoje środowisko programistyczne jest prawidłowo skonfigurowane. Zacznij od zintegrowania biblioteki Parser ze swoim projektem, ponieważ upraszcza ona proces obsługi i ekstrakcji tekstu z plików TXT. Po skonfigurowaniu biblioteki utwórz wystąpienie klasy Parser i określ ścieżkę do pliku TXT. Umożliwi Ci to wykorzystanie metody GetText, która pobiera obiekt TextReader. Za pomocą TextReader możesz następnie wywołać metodę ReadToEnd, aby wyodrębnić i odczytać całą zawartość pliku TXT. Takie podejście zapewnia, że możesz wydajnie zarządzać danymi tekstowymi i przetwarzać je dla różnych aplikacji.
Kod do wyodrębniania tekstu z TXT przy użyciu C#
using GroupDocs.Parser; | |
using GroupDocs.Parser.Options; | |
using System; | |
using System.IO; | |
namespace ExtractTextfromTXTusingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Set License to avoid the limitations of Parser library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Parser.lic"); | |
// Instantiate the Parser class | |
using (Parser parser = new Parser("input.txt")) | |
{ | |
// Retrieve formatted text into the reader | |
using (TextReader reader = parser.GetText()) | |
{ | |
// Output the formatted text from the document | |
// If formatted text extraction is not supported, | |
// the reader will be null | |
Console.WriteLine(reader == null ? | |
"Formatted text extraction isn't supported" | |
: reader.ReadToEnd()); | |
Console.ReadLine(); | |
} | |
} | |
} | |
} | |
} |
Podsumowując, C# read text from TXT to prosty proces, który może znacznie zwiększyć Twoje możliwości przetwarzania danych. Po zainstalowaniu sugerowanej biblioteki i ustawieniu odpowiednich ścieżek plików, włączenie podanego kodu do Twoich projektów będzie łatwe. Ten proces działa płynnie w systemach Windows, macOS i Linux, a nie będziesz potrzebować żadnego dodatkowego oprogramowania poza .NET. Gratulacje opanowania ekstrakcji tekstu z plików TXT przy użyciu C#! Twoje nowe umiejętności poprawią Twoją zdolność do wydajnego przetwarzania danych tekstowych.
Wcześniej udostępniliśmy szczegółowy przewodnik na temat wyodrębniania tekstu z plików EPUB za pomocą języka C#. Aby uzyskać bardziej szczegółowe informacje, zapoznaj się z naszym pełnym samouczkiem na temat wyodrębnij tekst z EPUB za pomocą C#.