Πώς να εξαγάγετε κείμενο από το αρχείο Markdown σε Java

Σε αυτό το άρθρο με οδηγίες, θα εξηγήσουμε τη διαδικασία βήμα προς βήμα για την εξαγωγή κειμένου από το αρχείο Markdown σε Java και την κοινή χρήση ενός δείγματος αποσπάσματος κώδικα για να δείξουμε την εφαρμογή του τρόπου λήψης κειμένου από το Markdown χρησιμοποιώντας Java**. Δεν χρειάζεται να εγκαταστήσετε κανένα άλλο εργαλείο τρίτου κατασκευαστή για την εξαγωγή κειμένου και αυτός ο οδηγός μπορεί να ακολουθηθεί σε οποιοδήποτε από τα κοινά λειτουργικά συστήματα, συμπεριλαμβανομένων των Windows, macOS και Linux. Παρακάτω είναι η ροή εργασίας και το απόσπασμα κώδικα για τη λήψη κειμένου από το αρχείο MD.

Βήματα για την εξαγωγή κειμένου από το αρχείο Markdown σε Java

  1. Ρυθμίστε το GroupDocs.Parser for Java από το αποθετήριο Maven στην εφαρμογή Java για εξαγωγή κειμένου από το αρχείο Markdown
  2. Εισαγάγετε τις απαιτούμενες κλάσεις για την ανάπτυξη της λειτουργικότητας για την εξαγωγή κειμένου από το έγγραφο Markdown
  3. Αρχικοποιήστε την κλάση Parser για τη φόρτωση του αρχείου MD για εξαγωγή κειμένου από αυτό
  4. Καλέστε τη μέθοδο getText για να αποκτήσετε το αντικείμενο ανάγνωσης κειμένου
  5. Τέλος, καλέστε τη μέθοδο readToEnd του προγράμματος ανάγνωσης και εκτυπώστε κείμενο στην οθόνη

Η εφαρμογή εξαγωγή κειμένου από MD σε Java μπορεί να δημιουργηθεί γρήγορα ακολουθώντας τα παραπάνω βήματα με μια σειρά. Η ροή εργασίας είναι πολύ απλή και μπορείτε να αρχικοποιήσετε τη διαδικασία εξαγωγής κειμένου ρυθμίζοντας την απαιτούμενη βιβλιοθήκη και εισάγοντας τις απαραίτητες κλάσεις. Μετά από αυτό, πρέπει να αρχικοποιήσετε την κλάση Parser για τη φόρτωση του αρχείου MD για τη λήψη κειμένου από αυτό. Τα δύο τελευταία βήματα σάς δίνουν τη δυνατότητα να λάβετε ένα κείμενο από το έγγραφο εισαγωγής και στη συνέχεια να το εκτυπώσετε στην οθόνη.

Κώδικας για εξαγωγή κειμένου από αρχείο Markdown σε Java

import com.groupdocs.parser.Parser;
import com.groupdocs.parser.licensing.License;
import com.groupdocs.parser.data.TextReader;
import java.io.IOException;
public class ExtractTextFromMarkdownFileInJava {
public static void main(String[] args) throws IOException { // Main function to extract text from Markdown in Java
// Remove the watermark in output
License lic = new License();
lic.setLicense("GroupDocs.Parser.lic");
// Create an instance of Parser class
try (Parser parser = new Parser("sample.md")) {
// Extract a text into the reader
try (TextReader reader = parser.getText()) {
// Print a text from the document
// If text extraction isn't supported, a reader is null
System.out.println(reader == null ? "Text extraction isn't supported" : reader.readToEnd());
}
}
}
}

Στο προηγούμενο απόσπασμα κώδικα, έχουμε αναπτύξει τη δυνατότητα εξαγωγής κειμένου από το αρχείο Markdown χρησιμοποιώντας Java με τη βοήθεια της ροής εργασίας που ορίστηκε στην προηγούμενη ενότητα. Αυτός είναι ένας λειτουργικός κώδικας και μπορείτε να τον χρησιμοποιήσετε στις εφαρμογές σας για εξαγωγή κειμένου, ωστόσο, μπορείτε να τον βελτιώσετε περαιτέρω σύμφωνα με τις απαιτήσεις σας. Επιπλέον, μπορείτε να τροποποιήσετε αυτό το παράδειγμα για τη λήψη κειμένου από άλλες μορφές εγγράφων όπως DOC, DOCX, PDF, XLSX, XML, HTML και πολλά άλλα.

Συζητήσαμε τη λεπτομερή διαδικασία του τρόπου λήψης κειμένου από το Markdown σε Java και αναπτύξαμε ένα δείγμα κώδικα για αυτό. Πρόσφατα, δημοσιεύσαμε ένα άρθρο σχετικά με την εξαγωγή εικόνων από το PowerPoint χρησιμοποιώντας Java, ρίξτε μια ματιά στον οδηγό πώς να εξάγετε εικόνες από το PowerPoint σε Java για περισσότερες πληροφορίες.

 Ελληνικά