Node.js का उपयोग करके PDF को TXT में बदलें

यदि आप PDF फ़ाइलों के साथ काम कर रहे हैं और सामग्री को संपादन योग्य प्रारूप में निकालने की आवश्यकता है, तो आप आसानी से Node.js का उपयोग करके PDF को TXT में परिवर्तित कर सकते हैं। फ़ॉर्मेटिंग की चिंता किए बिना दस्तावेज़ों से टेक्स्ट निकालने के लिए यह रूपांतरण प्रक्रिया अक्सर आवश्यक होती है। इस लेख में, हम आपको *Node.js में TXT में PDF निर्यात करने की प्रक्रिया के बारे में बताएंगे और इसके लिए एक व्यावहारिक दृष्टिकोण का पता लगाएंगे। बड़े डेटासेट, स्वचालित वर्कफ़्लो या टेक्स्ट-आधारित खोज अनुप्रयोगों से निपटने के दौरान यह रूपांतरण विशेष रूप से उपयोगी होता है। यह सुनिश्चित करता है कि निकाली गई सामग्री संरचित है, जिससे डेटाबेस में संसाधित करना, विश्लेषण करना या संग्रहीत करना आसान हो जाता है।

Node.js का उपयोग करके PDF को TXT में बदलने के चरण

  1. पीडीएफ से टीएक्सटी रूपांतरण को सक्षम करने के लिए अपने प्रोजेक्ट में जावा के माध्यम से Node.js के लिए GroupDocs.Conversion को सेट अप और एकीकृत करें
  2. अपने एप्लिकेशन में Groupdocs.conversion पैकेज शामिल करें
  3. Converter क्लास को इंस्टेंट करें और पीडीएफ दस्तावेज़ को लोड करने के लिए फ़ाइल पथ प्रदान करें
  4. WordProcessingConvertOptions को कॉन्फ़िगर करें और लक्ष्य आउटपुट स्वरूप के रूप में TXT का चयन करें
  5. पीडीएफ को संसाधित करने और एक TXT फ़ाइल तैयार करने के लिए कनवर्टर क्लास की कन्वर्ट विधि को कॉल करें

आपको सबसे पहले आवश्यक लाइब्रेरी स्थापित करनी होगी और अपने Node.js वातावरण को कॉन्फ़िगर करना होगा। नीचे दिया गया कोड दर्शाता है कि पीडीएफ फाइल को कैसे लोड किया जाए और उसे टेक्स्ट फाइल में कैसे बदला जाए। WordProcessingConvertOptions का उपयोग प्रारूप को TXT के रूप में निर्दिष्ट करने के लिए किया जाता है। एक बार रूपांतरण सेटिंग्स कॉन्फ़िगर हो जाने के बाद, आप प्रक्रिया को पूरा करने के लिए Converter.convert विधि को कॉल कर सकते हैं। यह प्रक्रिया आपको Node.js में PDF से TXT उत्पन्न करने की अनुमति देती है, और आप आगे की प्रक्रिया या भंडारण के लिए आउटपुट को TXT फ़ाइल के रूप में सहेज सकते हैं।

Node.js का उपयोग करके PDF को TXT में बदलने के लिए कोड

const conversion = require('@groupdocs/groupdocs.conversion')
const licensePath = "GroupDocs.Search.lic";
const license = new conversion.License()
license.setLicense(licensePath);
// Load the input PDF file
const converter = new conversion.Converter("sample.pdf");
const options = new conversion.WordProcessingConvertOptions();
options.setFormat(conversion.WordProcessingFileType.Txt);
// Save output TXT to disk
converter.convert("output.txt", options);
process.exit(0);

पीडीएफ को सादे पाठ में परिवर्तित करना खोज अनुक्रमण, डेटा निष्कर्षण और विभिन्न अनुप्रयोगों में आगे की प्रक्रिया जैसे कार्यों के लिए मूल्यवान है। यहां उल्लिखित विधि अतिरिक्त निर्भरता की आवश्यकता के बिना Node.js का उपयोग करके PDF को TXT में बदलने का एक विश्वसनीय तरीका प्रदान करती है। एक संरचित दृष्टिकोण का पालन करके, डेवलपर्स सटीकता और दक्षता दोनों सुनिश्चित करते हुए, पाठ रूपांतरण को सुचारू रूप से प्रबंधित कर सकते हैं। यह तकनीक पाठ-आधारित दस्तावेज़ प्रबंधन, सामग्री विश्लेषण या स्वचालित प्रसंस्करण पर केंद्रित अनुप्रयोगों के लिए विशेष रूप से फायदेमंद है। चाहे आप छोटी फ़ाइलों या पीडीएफ के बड़े बैचों के साथ काम कर रहे हों, यह विधि इष्टतम दक्षता बनाए रखते हुए निर्बाध रूपांतरण की गारंटी देती है।

पहले, हमने Node.js का उपयोग करके पीडीएफ को एमएचटीएमएल में परिवर्तित करने पर एक गहन मार्गदर्शिका प्रकाशित की थी। विस्तृत, चरण-दर-चरण निर्देशों के लिए, Node.js का उपयोग करके PDF को MHTML में बदलें पर हमारा पूरा ट्यूटोरियल अवश्य देखें।

 हिन्दी