C# का उपयोग करके RTF से टेक्स्ट निकालें

रिच टेक्स्ट फ़ॉर्मेट (RTF) फ़ाइलें एक लोकप्रिय दस्तावेज़ फ़ॉर्मेट हैं जो विभिन्न वर्ड प्रोसेसिंग अनुप्रयोगों में उनके लचीलेपन और व्यापक संगतता के लिए जानी जाती हैं। RTF फ़ाइलों से टेक्स्ट निकालना विभिन्न कार्यों के लिए आवश्यक हो सकता है, जैसे डेटा विश्लेषण, सामग्री प्रबंधन, या स्वचालित रिपोर्ट जनरेशन। इस लेख में, हम पार्सर लाइब्रेरी का लाभ उठाकर C# का उपयोग करके RTF से टेक्स्ट निकालने का तरीका जानेंगे। हम आवश्यक चरणों को कवर करेंगे और इस कार्यक्षमता को अपने C# प्रोजेक्ट में एकीकृत करने में आपकी सहायता के लिए एक नमूना कोड प्रदान करेंगे। C# में RTF से टेक्स्ट निकालना आपको विभिन्न संदर्भों में सामग्री को संसाधित करने और उपयोग करने में मदद कर सकता है, जैसे दस्तावेज़ों को अन्य फ़ॉर्मेट में परिवर्तित करना, सामग्री का विश्लेषण करना, या रिपोर्ट के निर्माण को स्वचालित करना।

C# का उपयोग करके RTF से टेक्स्ट निकालने के चरण

  1. GroupDocs.Parser for .NET लाइब्रेरी को शामिल करके अपने विकास परिवेश को कॉन्फ़िगर करें, जो आपको RTF फ़ाइलों से सहजता से पाठ निकालने में सक्षम बनाता है
  2. Parser क्लास का एक उदाहरण बनाएं और आरंभीकरण प्रक्रिया के भाग के रूप में अपनी RTF फ़ाइल का पथ निर्दिष्ट करें
  3. TextReader ऑब्जेक्ट को प्राप्त करने के लिए Parser इंस्टेंस पर GetText विधि को कॉल करें, जिसका उपयोग टेक्स्ट सामग्री तक पहुंचने के लिए किया जाएगा
  4. RTF फ़ाइल से संपूर्ण पाठ सामग्री निकालने और पढ़ने के लिए TextReader ऑब्जेक्ट पर ReadToEnd विधि को कॉल करें

यह प्रक्रिया दस्तावेज़ सामग्री को संसाधित करने और प्रबंधित करने की आपकी क्षमता को महत्वपूर्ण रूप से बढ़ा सकती है। इस गाइड में बताए गए चरणों का पालन करके, आप C# में RTF टेक्स्ट निष्कर्षण को कुशलतापूर्वक निष्पादित कर सकते हैं। यह दृष्टिकोण सुनिश्चित करता है कि आपके अनुप्रयोग RTF फ़ाइलों से टेक्स्ट को आसानी से संभाल सकते हैं, जिससे यह आपके दस्तावेज़ प्रसंस्करण अनुप्रयोगों के लिए एक मूल्यवान अतिरिक्त बन जाता है। चाहे आप डेटा माइग्रेशन, सामग्री विश्लेषण या स्वचालित रिपोर्टिंग पर काम कर रहे हों, RTF टेक्स्ट निष्कर्षण में महारत हासिल करने से आपके वर्कफ़्लो को सुव्यवस्थित किया जा सकता है और उत्पादकता में सुधार किया जा सकता है।

C# का उपयोग करके RTF से टेक्स्ट निकालने का कोड

using System;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Options;
namespace ExtractTextfromRTFusingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Apply the license to remove the limitations of the Parser library
License lic = new License();
lic.SetLicense(@"GroupDocs.Parser.lic");
// Instantiate the Parser class
using (Parser parser = new Parser("input.rtf"))
{
// Retrieve formatted text into the reader
using (TextReader reader = parser.GetFormattedText(
new FormattedTextOptions(FormattedTextMode.Html)))
{
// Output the formatted text from the document
// If formatted text extraction is not supported,
// the reader will be null
Console.WriteLine(reader == null ?
"Formatted text extraction isn't supported"
: reader.ReadToEnd());
Console.ReadLine();
}
}
}
}
}

अनुशंसित लाइब्रेरी स्थापित करने और सही फ़ाइल पथ सेट करने के बाद, आपके प्रोजेक्ट में दिए गए कोड को जोड़ना सरल होगा। टेक्स्ट निकालने की प्रक्रिया दस्तावेज़ सामग्री को संसाधित करने और प्रबंधित करने की आपकी क्षमता को महत्वपूर्ण रूप से बढ़ा सकती है। आप .NET को छोड़कर अतिरिक्त सॉफ़्टवेयर की आवश्यकता के बिना Windows, macOS और Linux ऑपरेटिंग सिस्टम पर C# RTF से टेक्स्ट पढ़ने संचालन को प्रभावी ढंग से निष्पादित कर सकते हैं। यह दृष्टिकोण सुनिश्चित करता है कि आपके एप्लिकेशन RTF फ़ाइलों से टेक्स्ट को आसानी से संभाल सकते हैं, जिससे यह आपके दस्तावेज़ प्रसंस्करण टूलकिट में एक मूल्यवान अतिरिक्त बन जाता है।

इससे पहले, हमने C# का उपयोग करके ODT फ़ाइलों से टेक्स्ट निकालने के बारे में विस्तृत गाइड प्रदान की थी। अधिक विस्तृत जानकारी के लिए, कृपया C# का उपयोग करके ODT से पाठ निकालें पर हमारा पूरा ट्यूटोरियल देखें।

 हिन्दी