Come estrarre il testo dal file Markdown in C#

Questo breve articolo spiega le istruzioni dettagliate per creare la funzionalità per estrarre il testo dal file Markdown in C# e ti guida su come utilizzare il flusso di lavoro per sviluppare l’applicazione per ottenere testo da Markdown utilizzando C# . Questo articolo ti aiuta anche a configurare rapidamente il pacchetto di conversione dei documenti dal sito Web NuGet e puoi farlo su uno qualsiasi dei sistemi operativi più diffusi come Windows, macOS e Linux. Di seguito sono riportati i punti chiave e uno snippet di codice per estrarre il testo dal file MD.

Passaggi per estrarre il testo dal file Markdown in C#

  1. Imposta il pacchetto GroupDocs.Parser for .NET dal gestore pacchetti NuGet nel progetto .NET per estrarre il testo dal documento Markdown
  2. Aggiungi un riferimento agli spazi dei nomi necessari per estrarre il testo da un file Markdown
  3. Crea un’istanza della classe Parser per caricare il file MD di input
  4. Utilizzare il metodo GetText della classe Parser per ottenere l’oggetto lettore di testo
  5. Infine, leggi il contenuto dal lettore e stampalo sullo schermo

I passaggi precedenti sono autoesplicativi e puoi seguirli facilmente per creare la funzionalità per estrarre il testo da Markdown utilizzando C#. Devi solo scrivere poche righe di codice e consumare poche chiamate API seguendo i passaggi precedenti in una sequenza per ottenere il testo dal file Markdown. Inoltre, queste istruzioni sono indipendenti dalla piattaforma e non è necessario installare alcuno strumento di terze parti per utilizzarle.

Codice per estrarre il testo dal file Markdown in C#

using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Data;
namespace ExtractTextFromMarkdownFileInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to extract Text from Markdown using C#
{
// Remove the watermark in output
string licensePath = "GroupDocs.Parser.lic";
GroupDocs.Parser.License lic = new GroupDocs.Parser.License();
lic.SetLicense(licensePath);
// Create an instance of Parser class and load Markdown file
using (Parser parser = new Parser("sample.md"))
{
// Extract a text into the reader
using(TextReader reader = parser.GetText())
{
// Print a text from the document
// If text extraction isn't supported, a reader is null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
}
}
}

Abbiamo scritto il codice di esempio precedente per dimostrare come sviluppare l’applicazione utilizzando le istruzioni spiegate nella sezione precedente per estrarre il testo dal file MD in C#. Questo esempio può essere utilizzato rapidamente nei tuoi progetti per ottenere un testo dai file MD, ma devi prima installare il pacchetto di conversione dei documenti. Inoltre, questo codice di esempio può essere adattato per estrarre il testo da una varietà di formati di documenti tra cui PDF, DOC, DOCX, XLS, XLSX, PPTX e molti altri.

Abbiamo discusso le istruzioni dettagliate per ottenere il testo dal file Markdown in C# e prodotto un’applicazione di esempio per questo. Di recente, abbiamo pubblicato un articolo per l’estrazione di testo da Excel utilizzando C#, dai un’occhiata alla guida come estrarre testo da Excel in C# per ulteriori informazioni.

 Italiano