C# का उपयोग करके पीडीएफ से टेक्स्ट कैसे निकालें

आज के डिजिटल युग में, C# प्रोग्रामिंग भाषाओं का उपयोग करके PDF दस्तावेज़ों से टेक्स्ट निकालने की क्षमता अविश्वसनीय रूप से मूल्यवान है। चाहे आप डेटा निष्कर्षण को स्वचालित कर रहे हों, खोज कार्यप्रणाली बना रहे हों, या पाठ्य सामग्री का विश्लेषण कर रहे हों, पीडीएफ के साथ प्रोग्रामेटिक रूप से काम करने की क्षमता आपकी प्रक्रियाओं को सुव्यवस्थित कर सकती है और दक्षता में सुधार कर सकती है। इस लेख में, हम आपको C#** का उपयोग करके पीडीएफ से टेक्स्ट निकालने के लिए आवश्यक चरणों के बारे में बताएंगे। आप निम्न चरणों का उपयोग करके C#** में पीडीएफ से पाठ को निर्बाध रूप से **निकालने के लिए व्यूअर लाइब्रेरी की शक्ति को नियंत्रित कर सकते हैं।

C# का उपयोग करके पीडीएफ से टेक्स्ट निकालने के चरण

  1. पीडीएफ से टेक्स्ट निकालने के लिए NuGet पैकेज मैनेजर का उपयोग करके GroupDocs.Viewer for .NET इंस्टॉल करें
  2. पीडीएफ टेक्स्ट निकालने के लिए, अपने प्रोजेक्ट में GroupDocs.Viewer संदर्भ जोड़ें
  3. कन्स्ट्रक्टर में पीडीएफ फ़ाइल के पथ का उपयोग करके Viewer क्लास ऑब्जेक्ट को इंस्टेंट करें
  4. दृश्य के बारे में जानकारी प्राप्त करने के लिए ViewInfoOptions.ForHtmlView विधि को कॉल करें
  5. पीडीएफ टेक्स्ट निष्कर्षण को सक्षम करने के लिए ViewInfoOptions.ExtractText प्रॉपर्टी को true पर सेट करें
  6. दस्तावेज़ पृष्ठों की संपूर्ण सूची तक पहुँचने के लिए PdfViewInfo.Pages प्रॉपर्टी का उपयोग करें
  7. प्रत्येक पंक्ति से पाठ निकालने के लिए Page.Lines का उपयोग करके प्रत्येक पृष्ठ पर पंक्तियों के संग्रह को दोहराएँ

C# का उपयोग करके पीडीएफ से टेक्स्ट निकालना सीखना आपको पीडीएफ दस्तावेज़ों में मौजूद जानकारी के भंडार का उपयोग करने में सक्षम बनाता है। चाहे आप डेटा-संचालित परियोजनाओं, दस्तावेज़ प्रबंधन, या व्यावसायिक प्रक्रियाओं को स्वचालित करने पर काम कर रहे हों, यह कौशल एक मूल्यवान संपत्ति है। आप अपने सिस्टम पर .NET स्थापित करने के बाद विंडोज, मैकओएस और लिनक्स जैसे व्यापक रूप से उपयोग किए जाने वाले ऑपरेटिंग सिस्टम पर सी# पीडीएफ से डेटा निकालने विधि को आसानी से कर सकते हैं। नीचे दिया गया कोड उदाहरण बताता है कि C# का उपयोग करके पीडीएफ फ़ाइल से टेक्स्ट कैसे निकाला जाए।

C# का उपयोग करके पीडीएफ से टेक्स्ट निकालने के लिए कोड

हमने इस गाइड में सी# से पीडीएफ से टेक्स्ट प्राप्त करें के मुख्य चरणों को देखा। आप उपरोक्त चरणों का पालन करके विभिन्न अनुप्रयोगों के लिए इस पाठ निष्कर्षण प्रक्रिया को आसानी से पूरा कर सकते हैं। सलाह दी गई लाइब्रेरी को सफलतापूर्वक स्थापित करने और फ़ाइल पथों में आवश्यक परिवर्तन करने के बाद निकालने वाले टेक्स्ट कोड को अपनी परियोजनाओं में एकीकृत करना एक सीधा और दर्द रहित ऑपरेशन बन जाता है।

पिछले ट्यूटोरियल में, हमने पीडीएफ को पीएनजी के रूप में प्रस्तुत करने के बारे में चर्चा की थी। यदि आपको और सहायता की आवश्यकता है, तो हम आपको सी# का उपयोग करके पीडीएफ को पीएनजी के रूप में प्रस्तुत करें कैसे करें पर हमारा लेख पढ़ने का सुझाव देते हैं।

 हिन्दी