जावा में वर्ड डॉक्यूमेंट से टेक्स्ट कैसे निकालें

इस कैसे-कैसे मार्गदर्शिका में, हम जावा में Word दस्तावेज़ से **निकालने Text की चरण-दर-चरण प्रक्रिया पर चर्चा करेंगे। इसके अलावा, आप सीखेंगे कि मावेन रिपॉजिटरी से आवश्यक लाइब्रेरी कैसे सेट करें और इस मैनुअल का उपयोग कैसे करें ताकि जावा का उपयोग करके ** DOCX से टेक्स्ट निकालने की कार्यक्षमता बनाई जा सके। नमूना कोड स्निपेट के साथ दस्तावेज़ों से टेक्स्ट निकालने के मुख्य बिंदु यहां दिए गए हैं।

जावा में वर्ड डॉक्यूमेंट से टेक्स्ट निकालने के चरण

  1. Word दस्तावेज़ से टेक्स्ट निकालने के लिए जावा प्रोजेक्ट में मावेन रिपॉजिटरी से GroupDocs.Parser for Java इंस्टॉल करें
  2. किसी Word फ़ाइल से पाठ निकालने के लिए कार्यक्षमता विकसित करने के लिए आवश्यक कक्षाएं आयात करें
  3. इनपुट वर्ड दस्तावेज़ लोड करने के लिए Parser क्लास को इंस्टेंट करें ताकि उसमें से टेक्स्ट निकाला जा सके
  4. पार्सर वर्ग की getText विधि को लागू करें और TextReader ऑब्जेक्ट प्राप्त करें
  5. अंत में, पाठक का पाठ पढ़ें

हमने उन सभी बिंदुओं को सूचीबद्ध किया है जो जावा एप्लिकेशन में *वर्ड डॉक्यूमेंट से *रीड टेक्स्ट बनाने के लिए आवश्यक हैं। विंडोज, मैकओएस और लिनक्स सहित किसी भी सामान्य ऑपरेटिंग सिस्टम में इन चरणों का पालन करना बहुत सरल है। इसके अलावा, आप किसी भी अतिरिक्त सॉफ़्टवेयर को स्थापित किए बिना दस्तावेज़ों से टेक्स्ट निकालने के लिए आसानी से एपीआई का उपभोग कर सकते हैं।

जावा में वर्ड डॉक्यूमेंट से टेक्स्ट निकालने के लिए कोड

import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.TextReader;
import java.io.IOException;
public class ExtractTextFromWordDocumentInJava {
public static void main(String[] args) throws IOException { // Main function to extract text from Word document in Java
// Create an instance of Parser class
try (Parser parser = new Parser("sample.docx")) {
// Extract a text into the reader
try (TextReader reader = parser.getText()) {
// Print a text from the document
// If text extraction isn't supported, a reader is null
System.out.println(reader == null ? "Text extraction isn't supported" : reader.readToEnd());
}
}
}
}

उपरोक्त कोड स्निपेट Word क्षमता से जावा टेक्स्ट एक्सट्रैक्टर के कार्यान्वयन को दर्शाता है। जैसा कि आप देख सकते हैं कि पुस्तकालय की स्थापना और आवश्यक वर्ग को आयात करने के बाद पार्सिंग के लिए इनपुट DOCX दस्तावेज़ को लोड करने के लिए पार्सर वर्ग का उपयोग किया जाता है। उसके बाद, हमने टेक्स्ट रीडर ऑब्जेक्ट प्राप्त करने के लिए गेटटेक्स्ट विधि का उपभोग किया है और फिर पाठक से टेक्स्ट पढ़ा है।

हमने जावा का उपयोग करके वर्ड डॉक्यूमेंट से टेक्स्ट निकालने की विस्तृत प्रक्रिया पर चर्चा की है और इसके लिए एक नमूना कोड तैयार किया है। हाल ही में, हमने जावा में Word दस्तावेज़ से चित्र निकालने पर एक लेख प्रकाशित किया है, अधिक जानकारी के लिए जावा का उपयोग करके Word दस्तावेज़ से छवियाँ कैसे निकालें मार्गदर्शिका देखें।

 हिन्दी