Ebben az útmutató cikkben lépésről lépésre elmagyarázzuk a szöveg kibontásának folyamatát a Markdown fájlból Java nyelven, és megosztunk egy minta kódrészletet, amely bemutatja a szöveg lekérésének megvalósítását. a Markdownból Java használatával. Nem kell semmilyen más harmadik féltől származó eszközt telepítenie a szöveg kibontásához, és ez az útmutató követhető bármely általános operációs rendszeren, beleértve a Windows, a macOS és a Linux rendszert. Az alábbiakban látható a munkafolyamat és a kódrészlet az MD-fájlból történő szöveg lekéréséhez.
Lépések a szöveg kibontásához a Markdown fájlból Java nyelven
- A Java alkalmazás Maven tárából állítsa be a GroupDocs.Parser for Java elemet, hogy szöveget kinyerhessen a Markdown fájlból
- Importálja a szükséges osztályokat a Markdown-dokumentum szövegének kinyeréséhez szükséges funkciók fejlesztéséhez
- Inicializálja a Parser osztályt az MD-fájl betöltéséhez, hogy szöveget kinyerhessen belőle
- Hívja a getText metódust a szövegolvasó objektum beszerzéséhez
- Végül hívja meg az olvasó readToEnd metódusát, és nyomtasson szöveget a képernyőre
A szövegkivonó az MD-ről Java alkalmazásban gyorsan létrehozható a fenti lépések egymás utáni követésével. A munkafolyamat nagyon egyszerű, és inicializálhatja a szövegkivonási eljárást a szükséges könyvtár beállításával és a szükséges osztályok importálásával. Ezt követően inicializálni kell az Parser osztályt az MD fájl betöltéséhez, hogy szöveget kapjunk belőle. Az utolsó két lépés lehetővé teszi, hogy szöveget nyerjen ki a bemeneti dokumentumból, majd nyomtassa ki a képernyőre.
Kód a szöveg kivonásához a Markdown fájlból Java nyelven
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.licensing.License; | |
import com.groupdocs.parser.data.TextReader; | |
import java.io.IOException; | |
public class ExtractTextFromMarkdownFileInJava { | |
public static void main(String[] args) throws IOException { // Main function to extract text from Markdown in Java | |
// Remove the watermark in output | |
License lic = new License(); | |
lic.setLicense("GroupDocs.Parser.lic"); | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.md")) { | |
// Extract a text into the reader | |
try (TextReader reader = parser.getText()) { | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
System.out.println(reader == null ? "Text extraction isn't supported" : reader.readToEnd()); | |
} | |
} | |
} | |
} |
Az előző kódrészletben kifejlesztettük azt a funkciót, amely a korábbi szakaszban definiált munkafolyamat segítségével kivonatolja ki a szöveget a Markdown fájlból Java segítségével. Ez egy működő kód, és felhasználhatja az alkalmazásaiban szövegkivonathoz, azonban igénye szerint továbbfejlesztheti. Ezenkívül módosíthatja ezt a példát más dokumentumformátumokból, például DOC, DOCX, PDF, XLSX, XML, HTML és még sok másból származó szövegek lekéréséhez.
Megbeszéltük annak részletes folyamatát, hogyan lehet szöveget lekérni a Markdownból Java nyelven, és kifejlesztettünk egy mintakódot hozzá. A közelmúltban közzétettünk egy cikket a képek PowerPointból Java segítségével történő kinyeréséről. További információért tekintse meg a hogyan lehet képeket kivonni a PowerPointból Java-ban útmutatót.