कैसे करें इस लेख में, हम जावा में ** Markdown फ़ाइल से टेक्स्ट निकालने ** की चरण-दर-चरण प्रक्रिया की व्याख्या करेंगे और ** टेक्स्ट प्राप्त करने के तरीके के कार्यान्वयन को प्रदर्शित करने के लिए एक नमूना कोड स्निपेट साझा करेंगे। मार्कडाउन से जावा ** का उपयोग कर। टेक्स्ट निकालने के लिए आपको कोई अन्य तृतीय-पक्ष टूल इंस्टॉल करने की आवश्यकता नहीं है और इस गाइड का अनुसरण विंडोज, मैकओएस और लिनक्स सहित किसी भी सामान्य ऑपरेटिंग सिस्टम पर किया जा सकता है। एमडी फ़ाइल से टेक्स्ट प्राप्त करने के लिए नीचे वर्कफ़्लो और कोड स्निपेट है।
जावा में मार्कडाउन फ़ाइल से टेक्स्ट निकालने के चरण
- मार्कडाउन फ़ाइल से टेक्स्ट निकालने के लिए जावा एप्लिकेशन में मावेन रिपॉजिटरी से GroupDocs.Parser for Java सेटअप करें
- मार्कडाउन दस्तावेज़ से पाठ निकालने के लिए कार्यक्षमता विकसित करने के लिए आवश्यक कक्षाएं आयात करें
- MD फ़ाइल से टेक्स्ट निकालने के लिए उसे लोड करने के लिए Parser क्लास को इनिशियलाइज़ करें
- टेक्स्ट रीडर ऑब्जेक्ट प्राप्त करने के लिए गेटटेक्स्ट विधि को कॉल करें
- अंत में, रीडर के रीड टू एंड मेथड को कॉल करें और स्क्रीन पर टेक्स्ट प्रिंट करें
जावा में एमडी से टेक्स्ट एक्सट्रैक्टर एप्लिकेशन को एक क्रम में उपरोक्त चरणों का पालन करके तेजी से बनाया जा सकता है। कार्यप्रवाह बहुत सरल है और आप आवश्यक पुस्तकालय स्थापित करके और आवश्यक कक्षाओं को आयात करके पाठ निष्कर्षण प्रक्रिया को आरंभ कर सकते हैं। उसके बाद, आपको एमडी फ़ाइल लोड करने के लिए पार्सर वर्ग को इससे टेक्स्ट प्राप्त करने के लिए प्रारंभ करना होगा। अंतिम दो चरण आपको सक्षम करते हैं कि इनपुट दस्तावेज़ से पाठ कैसे प्राप्त करें और फिर उसे स्क्रीन पर प्रिंट करें।
जावा में मार्कडाउन फ़ाइल से पाठ निकालने के लिए कोड
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.licensing.License; | |
import com.groupdocs.parser.data.TextReader; | |
import java.io.IOException; | |
public class ExtractTextFromMarkdownFileInJava { | |
public static void main(String[] args) throws IOException { // Main function to extract text from Markdown in Java | |
// Remove the watermark in output | |
License lic = new License(); | |
lic.setLicense("GroupDocs.Parser.lic"); | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.md")) { | |
// Extract a text into the reader | |
try (TextReader reader = parser.getText()) { | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
System.out.println(reader == null ? "Text extraction isn't supported" : reader.readToEnd()); | |
} | |
} | |
} | |
} |
पूर्ववर्ती कोड स्निपेट में, हमने पिछले अनुभाग में परिभाषित वर्कफ़्लो की सहायता से Java का उपयोग करके मार्कडाउन फ़ाइल से टेक्स्ट निकालने की कार्यक्षमता विकसित की है। यह एक कार्यशील कोड है और आप इसे अपने अनुप्रयोगों में पाठ निकालने के लिए उपयोग कर सकते हैं, हालाँकि, आप इसे अपनी आवश्यकताओं के अनुसार आगे बढ़ा सकते हैं। इसके अतिरिक्त, आप इस उदाहरण को अन्य दस्तावेज़ स्वरूपों जैसे DOC, DOCX, PDF, XLSX, XML, HTML, और कई अन्य दस्तावेज़ों से पाठ लाने के लिए संशोधित कर सकते हैं।
हमने जावा में मार्कडाउन से टेक्स्ट प्राप्त करने की विस्तृत प्रक्रिया पर चर्चा की है और इसके लिए एक नमूना कोड विकसित किया है। हाल ही में, हमने जावा का उपयोग करके PowerPoint से चित्र निकालने पर एक लेख प्रकाशित किया है, अधिक जानकारी के लिए कैसे जावा में PowerPoint से छवियों को निकालने के लिए मार्गदर्शिका देखें।