Как да извлечете текст от Markdown файл в C#

Тази кратка статия обяснява поетапните инструкции за създаване на функционалност за извличане на текст от файл Markdown в C# и ви напътства как да използвате работния процес за разработване на приложението за получаване на текст от Markdown с помощта на C# . Тази статия също така ви помага бързо да настроите пакета за конвертиране на документи от уебсайта на NuGet и можете да го направите на всяка от популярните операционни системи като Windows, macOS и Linux. По-долу са ключовите точки и кодов фрагмент за извличане на текст от MD файла.

Стъпки за извличане на текст от Markdown файл в C#

  1. Настройте пакет GroupDocs.Parser for .NET от мениджъра на пакети NuGet в проекта .NET, за да извлечете текст от документа Markdown
  2. Добавете препратка към необходимите пространства от имена за извличане на текст от Markdown файл
  3. Създайте екземпляр на класа Parser за зареждане на входния MD файл
  4. Използвайте метода GetText на класа Parser, за да получите обекта за четене на текст
  5. Накрая прочетете съдържанието от четеца и го отпечатайте на екрана

Горните стъпки се обясняват сами по себе си и можете лесно да ги следвате, за да създадете функционалността за извличане на текст от Markdown с помощта на C#. Трябва да напишете само няколко реда код и да използвате няколко извиквания на API, като следвате горните стъпки в последователност, за да получите текста от Markdown файла. Освен това тези инструкции са независими от платформата и не е необходимо да инсталирате инструмент на трета страна, за да ги използвате.

Код за извличане на текст от Markdown файл в C#

using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Data;
namespace ExtractTextFromMarkdownFileInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to extract Text from Markdown using C#
{
// Remove the watermark in output
string licensePath = "GroupDocs.Parser.lic";
GroupDocs.Parser.License lic = new GroupDocs.Parser.License();
lic.SetLicense(licensePath);
// Create an instance of Parser class and load Markdown file
using (Parser parser = new Parser("sample.md"))
{
// Extract a text into the reader
using(TextReader reader = parser.GetText())
{
// Print a text from the document
// If text extraction isn't supported, a reader is null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
}
}
}

Написахме горния примерен код, за да демонстрираме как да разработим приложението, използвайки инструкциите, обяснени в предишния раздел, за извличане на текст от MD файл в C#. Този пример може бързо да се използва във вашите проекти за получаване на текст от MD файлове, но първо трябва да инсталирате пакета за конвертиране на документи. Освен това този примерен код може да бъде адаптиран за извличане на текст от различни формати на документи, включително PDF, DOC, DOCX, XLS, XLSX, PPTX и много други.

Обсъдихме подробните инструкции за получаване на текст от файла Markdown в C# и създадохме примерно приложение за него. Наскоро публикувахме статия за извличане на текст от Excel с помощта на C#, вижте ръководството как да извлечете текст от Excel в C# за повече информация.

 Български