सी # में एचटीएमएल से टेक्स्ट कैसे निकालें

इस कैसे-कैसे लेख में, हम सी#** में HTML से **पाठ निकालने के लिए चरण-दर-चरण प्रक्रिया पर ध्यान केंद्रित करेंगे और इस मार्गदर्शिका का उपयोग करने के लिए **C# से पाठ निकालें एचटीएमएल ** कार्यक्षमता। इस मैनुअल के लिए आपको कुछ साधारण एपीआई कॉलों का उपयोग करके टेक्स्ट निकालने के लिए HTML दस्तावेज़ प्रदान करने की आवश्यकता है। नीचे आप पूरी जानकारी के साथ-साथ C# का उपयोग करके HTML से टेक्स्ट निकालने के लिए एक कार्यशील उदाहरण पर एक नज़र डाल सकते हैं।

सी # में एचटीएमएल से टेक्स्ट निकालने के लिए कदम

  1. HTML से टेक्स्ट निकालने के लिए .NET प्रोजेक्ट में NuGet वेबसाइट से GroupDocs.Parser for .NET पैकेज इंस्टॉल करें
  2. HTML दस्तावेज़ से टेक्स्ट निकालने के लिए आवश्यक नामस्थानों का संदर्भ जोड़ें
  3. इनपुट HTML दस्तावेज़ लोड करने के लिए Parser वर्ग का एक उदाहरण बनाएं
  4. TextReader ऑब्जेक्ट को इकट्ठा करने के लिए पार्सर वर्ग की GetText विधि को कॉल करें
  5. TextReader से पाठ पढ़ें और इसे कंसोल पर प्रदर्शित करें

पूर्ववर्ती चरणवार निर्देश आपको HTML C#* एप्लिकेशन से *Extract Text को शीघ्रता से बनाने में सक्षम बनाते हैं। ये उपयोग में आसान निर्देश हैं और न्यूनतम विकास अनुभव वाला कोई भी व्यक्ति दस्तावेज़ों से पाठ प्राप्त करने के लिए उनका अनुसरण कर सकता है। इसके अलावा, आप किसी भी सामान्य ऑपरेटिंग सिस्टम जैसे एमएस विंडोज, लिनक्स और मैकओएस पर इन बिंदुओं का उपभोग कर सकते हैं। इसके अलावा, आप कोई अतिरिक्त सॉफ़्टवेयर सेट किए बिना टेक्स्ट निकालने के लिए API को कॉल कर सकते हैं।

सी # में एचटीएमएल से टेक्स्ट निकालने के लिए कोड

HTML से C# गेट टेक्स्ट पिछले अनुभाग में बताए गए चरणों का पालन करके विकसित किया गया है। आप उपरोक्त कोड स्निपेट में देख सकते हैं कि आवश्यक पैकेज को कॉन्फ़िगर करके और आवश्यक नामस्थानों के संदर्भ को जोड़कर टेक्स्ट निष्कर्षण प्रक्रिया शुरू की गई है। अगले चरणों में, हमने पार्सर वर्ग का एक उदाहरण बनाकर इनपुट HTML दस्तावेज़ लोड किया है और फिर TextReader ऑब्जेक्ट प्राप्त करने के लिए GetText विधि का उपयोग करें और अंत में इससे टेक्स्ट पढ़ें।

हमने HTML C# एप्लिकेशन से टेक्स्ट प्राप्त करने के लिए विस्तृत निर्देशों पर चर्चा की है। हाल ही में, हमने C# का उपयोग करके Excel फ़ाइल से मेटाडेटा निकालने के लिए एक लेख प्रकाशित किया है, अधिक जानकारी के लिए सी # में एक्सेल फ़ाइल से मेटाडेटा कैसे निकालें मार्गदर्शिका देखें।

 हिन्दी