Jak wyodrębnić tekst z pliku Markdown w C#

Ten krótki artykuł wyjaśnia krok po kroku instrukcje tworzenia funkcji wyodrębniania tekstu z pliku Markdown w C# i pokazuje, jak używać przepływu pracy do tworzenia aplikacji do pobierania tekstu z Markdown przy użyciu C# . Ten artykuł pomaga również szybko skonfigurować pakiet konwersji dokumentów z witryny internetowej NuGet i można to zrobić w dowolnym popularnym systemie operacyjnym, takim jak Windows, macOS i Linux. Poniżej znajdują się kluczowe punkty i fragment kodu do wyodrębniania tekstu z pliku MD.

Kroki, aby wyodrębnić tekst z pliku Markdown w C#

  1. Skonfiguruj pakiet GroupDocs.Parser for .NET z menedżera pakietów NuGet w projekcie .NET, aby wyodrębnić tekst z dokumentu Markdown
  2. Dodaj odwołanie do przestrzeni nazw niezbędnych do wyodrębnienia tekstu z pliku Markdown
  3. Utwórz instancję klasy Parser do ładowania wejściowego pliku MD
  4. Użyj metody GetText klasy Parser, aby uzyskać obiekt czytnika tekstu
  5. Na koniec przeczytaj treść z czytnika i wydrukuj ją na ekranie

Powyższe kroki są oczywiste i można je łatwo wykonać, aby utworzyć funkcję wyodrębniania tekstu z języka Markdown przy użyciu języka C#. Musisz napisać tylko kilka wierszy kodu i wykonać kilka wywołań interfejsu API, wykonując powyższe kroki w kolejności pobierania tekstu z pliku Markdown. Ponadto instrukcje te są niezależne od platformy i nie trzeba instalować żadnego narzędzia innej firmy, aby z nich korzystać.

Kod do wyodrębnienia tekstu z pliku Markdown w C#

using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Data;
namespace ExtractTextFromMarkdownFileInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to extract Text from Markdown using C#
{
// Remove the watermark in output
string licensePath = "GroupDocs.Parser.lic";
GroupDocs.Parser.License lic = new GroupDocs.Parser.License();
lic.SetLicense(licensePath);
// Create an instance of Parser class and load Markdown file
using (Parser parser = new Parser("sample.md"))
{
// Extract a text into the reader
using(TextReader reader = parser.GetText())
{
// Print a text from the document
// If text extraction isn't supported, a reader is null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
}
}
}

Napisaliśmy powyższy przykładowy kod, aby zademonstrować, jak opracować aplikację, korzystając z instrukcji wyjaśnionych w poprzedniej sekcji, aby wyodrębnić tekst z pliku MD w C#. Ten przykład można szybko wykorzystać w swoich projektach do pobierania tekstu z plików MD, ale musisz najpierw zainstalować pakiet do konwersji dokumentów. Co więcej, ten przykładowy kod można dostosować do wyodrębniania tekstu z różnych formatów dokumentów, w tym PDF, DOC, DOCX, XLS, XLSX, PPTX i wielu innych.

Omówiliśmy szczegółowe instrukcje pobierania tekstu z pliku Markdown w języku C# i stworzyliśmy dla niego przykładową aplikację. Niedawno opublikowaliśmy artykuł na temat wydobywania tekstu z Excela przy użyciu C#, zajrzyj do przewodnika jak wyodrębnić tekst z Excela w C#, aby uzyskać więcej informacji.

 Polski