Ten krótki artykuł wyjaśnia krok po kroku instrukcje tworzenia funkcji wyodrębniania tekstu z pliku Markdown w C# i pokazuje, jak używać przepływu pracy do tworzenia aplikacji do pobierania tekstu z Markdown przy użyciu C# . Ten artykuł pomaga również szybko skonfigurować pakiet konwersji dokumentów z witryny internetowej NuGet i można to zrobić w dowolnym popularnym systemie operacyjnym, takim jak Windows, macOS i Linux. Poniżej znajdują się kluczowe punkty i fragment kodu do wyodrębniania tekstu z pliku MD.
Kroki, aby wyodrębnić tekst z pliku Markdown w C#
- Skonfiguruj pakiet GroupDocs.Parser for .NET z menedżera pakietów NuGet w projekcie .NET, aby wyodrębnić tekst z dokumentu Markdown
- Dodaj odwołanie do przestrzeni nazw niezbędnych do wyodrębnienia tekstu z pliku Markdown
- Utwórz instancję klasy Parser do ładowania wejściowego pliku MD
- Użyj metody GetText klasy Parser, aby uzyskać obiekt czytnika tekstu
- Na koniec przeczytaj treść z czytnika i wydrukuj ją na ekranie
Powyższe kroki są oczywiste i można je łatwo wykonać, aby utworzyć funkcję wyodrębniania tekstu z języka Markdown przy użyciu języka C#. Musisz napisać tylko kilka wierszy kodu i wykonać kilka wywołań interfejsu API, wykonując powyższe kroki w kolejności pobierania tekstu z pliku Markdown. Ponadto instrukcje te są niezależne od platformy i nie trzeba instalować żadnego narzędzia innej firmy, aby z nich korzystać.
Kod do wyodrębnienia tekstu z pliku Markdown w C#
using System; | |
using System.Collections.Generic; | |
using System.Text; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractTextFromMarkdownFileInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract Text from Markdown using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class and load Markdown file | |
using (Parser parser = new Parser("sample.md")) | |
{ | |
// Extract a text into the reader | |
using(TextReader reader = parser.GetText()) | |
{ | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd()); | |
} | |
} | |
} | |
} | |
} |
Napisaliśmy powyższy przykładowy kod, aby zademonstrować, jak opracować aplikację, korzystając z instrukcji wyjaśnionych w poprzedniej sekcji, aby wyodrębnić tekst z pliku MD w C#. Ten przykład można szybko wykorzystać w swoich projektach do pobierania tekstu z plików MD, ale musisz najpierw zainstalować pakiet do konwersji dokumentów. Co więcej, ten przykładowy kod można dostosować do wyodrębniania tekstu z różnych formatów dokumentów, w tym PDF, DOC, DOCX, XLS, XLSX, PPTX i wielu innych.
Omówiliśmy szczegółowe instrukcje pobierania tekstu z pliku Markdown w języku C# i stworzyliśmy dla niego przykładową aplikację. Niedawno opublikowaliśmy artykuł na temat wydobywania tekstu z Excela przy użyciu C#, zajrzyj do przewodnika jak wyodrębnić tekst z Excela w C#, aby uzyskać więcej informacji.