सी # में पीडीएफ से टेक्स्ट कैसे निकालें

यह त्वरित ट्यूटोरियल सी#** में PDF से पाठ निकालने के विस्तृत निर्देशों की व्याख्या करता है। यह सी# का उपयोग करके **पीडीएफ से टेक्स्ट निकालने के लिए कार्यान्वयन दिखाने के लिए नमूना एप्लिकेशन भी प्रदान करता है। यह मार्गदर्शिका विभिन्न दस्तावेज़ स्वरूपों से दस्तावेज़ डेटा निकालने के लिए लोकप्रिय पैकेजों में से एक का उपयोग करती है। पीडीएफ से टेक्स्ट प्राप्त करने के लिए मुख्य चरण और नमूना कोड नीचे दिए गए हैं।

सी # में पीडीएफ से टेक्स्ट निकालने के लिए कदम

  1. पीडीएफ से टेक्स्ट निकालने के लिए .NET एप्लिकेशन में NuGet पैकेज मैनेजर से सेटअप GroupDocs.Parser for .NET पैकेज
  2. पीडीएफ दस्तावेज़ से टेक्स्ट निकालने के लिए आवश्यक नामस्थानों का संदर्भ जोड़ें
  3. इनपुट PDF दस्तावेज़ लोड करने के लिए Parser वर्ग को तत्काल करें
  4. GetText विधि को कॉल करें और टेक्स्ट रीडर ऑब्जेक्ट प्राप्त करें
  5. अंत में, पाठक से पाठ पढ़ें और उसे प्रदर्शित करें

हमने पीडीएफ एप्लिकेशन से *सी# एक्सट्रैक्ट टेक्स्ट को विकसित करने के लिए सभी महत्वपूर्ण चरणों को सूचीबद्ध किया है। पीडीएफ से टेक्स्ट निकालने के लिए इन निर्देशों का उपयोग एमएस विंडोज, लिनक्स और मैकओएस जैसे किसी भी प्लेटफॉर्म पर किया जा सकता है जो .NET वातावरण का समर्थन करता है और यहां तक कि किसी तीसरे पक्ष के सॉफ़्टवेयर को स्थापित किए बिना भी। आपको कोड की कुछ पंक्तियाँ लिखनी होंगी जिसमें दस्तावेज़ निष्कर्षण पुस्तकालय के API कॉल शामिल हों।

सी # में पीडीएफ से पाठ निकालने के लिए कोड

उपरोक्त कोड स्निपेट में, हमने आपको दस्तावेज़ों से टेक्स्ट प्राप्त करने का कार्य दिखाने के लिए C# रीड पीडीएफ टेक्स्ट एप्लिकेशन विकसित किया है। हमने इस उदाहरण में टेक्स्ट निकालने के लिए एक पीडीएफ फाइल का उपयोग किया है, हालांकि, आप विभिन्न अन्य दस्तावेजों जैसे डीओसी, डीओसीएक्स, एक्सएलएस, एक्सएलएसएक्स, पीपीटीएक्स, एमएसजी, एक्सएमएल, ज़िप, और कई अन्य से टेक्स्ट निकाल सकते हैं।

हमने पीडीएफ कार्यक्षमता से सी # प्राप्त टेक्स्ट को लागू करने के लिए प्रक्रिया पर विस्तार से चर्चा की है और इसके लिए एक नमूना कोड बनाया है। हाल ही में, हमने C# में PDF से मेटाडेटा निकालने के लिए एक लेख प्रकाशित किया है, अधिक जानकारी के लिए सी # का उपयोग कर पीडीएफ से मेटाडेटा कैसे निकालें मार्गदर्शिका देखें।

 हिन्दी