रिच टेक्स्ट फ़ॉर्मेट (RTF) फ़ाइल का इस्तेमाल इसके लचीलेपन और कई वर्ड प्रोसेसिंग अनुप्रयोगों के साथ संगतता के कारण व्यापक रूप से किया जाता है। Java का उपयोग करके RTF से टेक्स्ट निकालने की क्षमता कई कार्यों के लिए महत्वपूर्ण है, जिसमें डेटा विश्लेषण, सामग्री प्रबंधन और रिपोर्ट निर्माण का स्वचालन शामिल है। इस लेख में, हम आपको पार्सर लाइब्रेरी का उपयोग करके यह करने का तरीका बताएंगे। हम आवश्यक चरणों की व्याख्या करेंगे और इस सुविधा को अपने Java प्रोजेक्ट में आसानी से एकीकृत करने में आपकी सहायता के लिए नमूना कोड प्रदान करेंगे। Java में RTF से टेक्स्ट निकालना सीखने से आपको विभिन्न उद्देश्यों के लिए सामग्री को प्रबंधित करने और उसका उपयोग करने में मदद मिलेगी, जैसे कि दस्तावेज़ों को परिवर्तित करना, सामग्री का विश्लेषण करना या रिपोर्ट निर्माण को स्वचालित करना।
जावा का उपयोग करके RTF से टेक्स्ट निकालने के चरण
- अपने विकास परिवेश को GroupDocs.Parser for Java लाइब्रेरी को शामिल करने के लिए कॉन्फ़िगर करके आरंभ करें, जो RTF फ़ाइलों से निर्बाध पाठ निष्कर्षण की सुविधा प्रदान करता है
- Parser क्लास को इंस्टैंसिएट करें और आरंभीकरण के दौरान अपनी RTF फ़ाइल का पथ प्रदान करें
- TextReader ऑब्जेक्ट प्राप्त करने के लिए Parser इंस्टेंस की getText विधि का उपयोग करें, जो आपको RTF फ़ाइल की पाठ सामग्री तक पहुंचने की अनुमति देगा
- अंत में, RTF फ़ाइल से पूर्ण पाठ सामग्री को निकालने और पढ़ने के लिए TextReader ऑब्जेक्ट पर readToEnd विधि को कॉल करें
Java में RTF टेक्स्ट एक्सट्रैक्शन के मुख्य चरण में, आपको सबसे पहले Parser क्लास को इंस्टेंटिएट करना होगा और इनिशियलाइज़ेशन के दौरान अपनी RTF फ़ाइल का पथ प्रदान करना होगा। यह Parser क्लास के कंस्ट्रक्टर को एक तर्क के रूप में फ़ाइल पथ पास करके किया जाता है। एक बार Parser ऑब्जेक्ट बन जाने के बाद, यह RTF फ़ाइल से कनेक्शन स्थापित करता है, जिससे आप इसकी सामग्री तक पहुँच सकते हैं और उसे निकाल सकते हैं। यह सरल इनिशियलाइज़ेशन सहज टेक्स्ट एक्सट्रैक्शन के लिए आधार तैयार करता है, जिससे Parser ऑब्जेक्ट फ़ाइल के साथ इंटरैक्ट कर सकता है और इसके टेक्स्टुअल डेटा को कुशलतापूर्वक प्राप्त कर सकता है। नीचे दिया गया कोड उदाहरण दिखाता है कि RTF फ़ाइल से टेक्स्ट एक्सट्रैक्शन कैसे किया जाता है।
जावा का उपयोग करके RTF से टेक्स्ट निकालने का कोड
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.data.TextReader; | |
import com.groupdocs.parser.licensing.License; | |
public class ExtractTextfromRTFusingJava { | |
public static void main(String[] args) throws Exception { | |
// Set License to avoid the limitations of Parser library | |
License license = new License(); | |
license.setLicense("GroupDocs.Parser.lic"); | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("input.rtf")) { | |
// Extract a text into the reader | |
try (TextReader reader = parser.getText()) { | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
System.out.println(reader == null ? "Text extraction isn't supported" | |
: reader.readToEnd()); | |
} | |
} | |
} | |
} |
एक बार जब आप अनुशंसित लाइब्रेरी स्थापित कर लेते हैं और फ़ाइल पथों को सही ढंग से कॉन्फ़िगर कर लेते हैं, तो आपके प्रोजेक्ट में दिए गए कोड को एकीकृत करना एक सहज प्रक्रिया होगी। कुशल टेक्स्ट निष्कर्षण दस्तावेज़ सामग्री को प्रबंधित करने और संसाधित करने की आपकी क्षमता में बहुत सुधार कर सकता है। आप Windows, macOS और Linux सिस्टम पर Java रीड टेक्स्ट फ्रॉम RTF कार्यों को प्रभावी ढंग से कर सकते हैं, बिना Java के अलावा किसी अतिरिक्त सॉफ़्टवेयर की आवश्यकता के। यह विधि गारंटी देती है कि आपके एप्लिकेशन RTF टेक्स्ट को आसानी से संभाल सकते हैं, जिससे यह आपके दस्तावेज़ प्रसंस्करण क्षमताओं में एक अमूल्य वृद्धि बन जाती है।
इससे पहले, हमने जावा के साथ ODT फ़ाइलों से टेक्स्ट निकालने पर एक गहन गाइड पेश की थी। अधिक विस्तृत अवलोकन के लिए, कृपया जावा का उपयोग करके ODT से पाठ निकालें पर हमारा पूरा ट्यूटोरियल देखें।