Hogyan lehet szöveget kivonni a Markdown fájlból Java-ban

Ebben az útmutató cikkben lépésről lépésre elmagyarázzuk a szöveg kibontásának folyamatát a Markdown fájlból Java nyelven, és megosztunk egy minta kódrészletet, amely bemutatja a szöveg lekérésének megvalósítását. a Markdownból Java használatával. Nem kell semmilyen más harmadik féltől származó eszközt telepítenie a szöveg kibontásához, és ez az útmutató követhető bármely általános operációs rendszeren, beleértve a Windows, a macOS és a Linux rendszert. Az alábbiakban látható a munkafolyamat és a kódrészlet az MD-fájlból történő szöveg lekéréséhez.

Lépések a szöveg kibontásához a Markdown fájlból Java nyelven

  1. A Java alkalmazás Maven tárából állítsa be a GroupDocs.Parser for Java elemet, hogy szöveget kinyerhessen a Markdown fájlból
  2. Importálja a szükséges osztályokat a Markdown-dokumentum szövegének kinyeréséhez szükséges funkciók fejlesztéséhez
  3. Inicializálja a Parser osztályt az MD-fájl betöltéséhez, hogy szöveget kinyerhessen belőle
  4. Hívja a getText metódust a szövegolvasó objektum beszerzéséhez
  5. Végül hívja meg az olvasó readToEnd metódusát, és nyomtasson szöveget a képernyőre

A szövegkivonó az MD-ről Java alkalmazásban gyorsan létrehozható a fenti lépések egymás utáni követésével. A munkafolyamat nagyon egyszerű, és inicializálhatja a szövegkivonási eljárást a szükséges könyvtár beállításával és a szükséges osztályok importálásával. Ezt követően inicializálni kell az Parser osztályt az MD fájl betöltéséhez, hogy szöveget kapjunk belőle. Az utolsó két lépés lehetővé teszi, hogy szöveget nyerjen ki a bemeneti dokumentumból, majd nyomtassa ki a képernyőre.

Kód a szöveg kivonásához a Markdown fájlból Java nyelven

import com.groupdocs.parser.Parser;
import com.groupdocs.parser.licensing.License;
import com.groupdocs.parser.data.TextReader;
import java.io.IOException;
public class ExtractTextFromMarkdownFileInJava {
public static void main(String[] args) throws IOException { // Main function to extract text from Markdown in Java
// Remove the watermark in output
License lic = new License();
lic.setLicense("GroupDocs.Parser.lic");
// Create an instance of Parser class
try (Parser parser = new Parser("sample.md")) {
// Extract a text into the reader
try (TextReader reader = parser.getText()) {
// Print a text from the document
// If text extraction isn't supported, a reader is null
System.out.println(reader == null ? "Text extraction isn't supported" : reader.readToEnd());
}
}
}
}

Az előző kódrészletben kifejlesztettük azt a funkciót, amely a korábbi szakaszban definiált munkafolyamat segítségével kivonatolja ki a szöveget a Markdown fájlból Java segítségével. Ez egy működő kód, és felhasználhatja az alkalmazásaiban szövegkivonathoz, azonban igénye szerint továbbfejlesztheti. Ezenkívül módosíthatja ezt a példát más dokumentumformátumokból, például DOC, DOCX, PDF, XLSX, XML, HTML és még sok másból származó szövegek lekéréséhez.

Megbeszéltük annak részletes folyamatát, hogyan lehet szöveget lekérni a Markdownból Java nyelven, és kifejlesztettünk egy mintakódot hozzá. A közelmúltban közzétettünk egy cikket a képek PowerPointból Java segítségével történő kinyeréséről. További információért tekintse meg a hogyan lehet képeket kivonni a PowerPointból Java-ban útmutatót.

 Magyar