रिच टेक्स्ट फ़ॉर्मेट (RTF) फ़ाइलें एक लोकप्रिय दस्तावेज़ फ़ॉर्मेट हैं जो विभिन्न वर्ड प्रोसेसिंग अनुप्रयोगों में उनके लचीलेपन और व्यापक संगतता के लिए जानी जाती हैं। RTF फ़ाइलों से टेक्स्ट निकालना विभिन्न कार्यों के लिए आवश्यक हो सकता है, जैसे डेटा विश्लेषण, सामग्री प्रबंधन, या स्वचालित रिपोर्ट जनरेशन। इस लेख में, हम पार्सर लाइब्रेरी का लाभ उठाकर C# का उपयोग करके RTF से टेक्स्ट निकालने का तरीका जानेंगे। हम आवश्यक चरणों को कवर करेंगे और इस कार्यक्षमता को अपने C# प्रोजेक्ट में एकीकृत करने में आपकी सहायता के लिए एक नमूना कोड प्रदान करेंगे। C# में RTF से टेक्स्ट निकालना आपको विभिन्न संदर्भों में सामग्री को संसाधित करने और उपयोग करने में मदद कर सकता है, जैसे दस्तावेज़ों को अन्य फ़ॉर्मेट में परिवर्तित करना, सामग्री का विश्लेषण करना, या रिपोर्ट के निर्माण को स्वचालित करना।
C# का उपयोग करके RTF से टेक्स्ट निकालने के चरण
- GroupDocs.Parser for .NET लाइब्रेरी को शामिल करके अपने विकास परिवेश को कॉन्फ़िगर करें, जो आपको RTF फ़ाइलों से सहजता से पाठ निकालने में सक्षम बनाता है
- Parser क्लास का एक उदाहरण बनाएं और आरंभीकरण प्रक्रिया के भाग के रूप में अपनी RTF फ़ाइल का पथ निर्दिष्ट करें
- TextReader ऑब्जेक्ट को प्राप्त करने के लिए Parser इंस्टेंस पर GetText विधि को कॉल करें, जिसका उपयोग टेक्स्ट सामग्री तक पहुंचने के लिए किया जाएगा
- RTF फ़ाइल से संपूर्ण पाठ सामग्री निकालने और पढ़ने के लिए TextReader ऑब्जेक्ट पर ReadToEnd विधि को कॉल करें
यह प्रक्रिया दस्तावेज़ सामग्री को संसाधित करने और प्रबंधित करने की आपकी क्षमता को महत्वपूर्ण रूप से बढ़ा सकती है। इस गाइड में बताए गए चरणों का पालन करके, आप C# में RTF टेक्स्ट निष्कर्षण को कुशलतापूर्वक निष्पादित कर सकते हैं। यह दृष्टिकोण सुनिश्चित करता है कि आपके अनुप्रयोग RTF फ़ाइलों से टेक्स्ट को आसानी से संभाल सकते हैं, जिससे यह आपके दस्तावेज़ प्रसंस्करण अनुप्रयोगों के लिए एक मूल्यवान अतिरिक्त बन जाता है। चाहे आप डेटा माइग्रेशन, सामग्री विश्लेषण या स्वचालित रिपोर्टिंग पर काम कर रहे हों, RTF टेक्स्ट निष्कर्षण में महारत हासिल करने से आपके वर्कफ़्लो को सुव्यवस्थित किया जा सकता है और उत्पादकता में सुधार किया जा सकता है।
C# का उपयोग करके RTF से टेक्स्ट निकालने का कोड
using System; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Options; | |
namespace ExtractTextfromRTFusingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Apply the license to remove the limitations of the Parser library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Parser.lic"); | |
// Instantiate the Parser class | |
using (Parser parser = new Parser("input.rtf")) | |
{ | |
// Retrieve formatted text into the reader | |
using (TextReader reader = parser.GetFormattedText( | |
new FormattedTextOptions(FormattedTextMode.Html))) | |
{ | |
// Output the formatted text from the document | |
// If formatted text extraction is not supported, | |
// the reader will be null | |
Console.WriteLine(reader == null ? | |
"Formatted text extraction isn't supported" | |
: reader.ReadToEnd()); | |
Console.ReadLine(); | |
} | |
} | |
} | |
} | |
} |
अनुशंसित लाइब्रेरी स्थापित करने और सही फ़ाइल पथ सेट करने के बाद, आपके प्रोजेक्ट में दिए गए कोड को जोड़ना सरल होगा। टेक्स्ट निकालने की प्रक्रिया दस्तावेज़ सामग्री को संसाधित करने और प्रबंधित करने की आपकी क्षमता को महत्वपूर्ण रूप से बढ़ा सकती है। आप .NET को छोड़कर अतिरिक्त सॉफ़्टवेयर की आवश्यकता के बिना Windows, macOS और Linux ऑपरेटिंग सिस्टम पर C# RTF से टेक्स्ट पढ़ने संचालन को प्रभावी ढंग से निष्पादित कर सकते हैं। यह दृष्टिकोण सुनिश्चित करता है कि आपके एप्लिकेशन RTF फ़ाइलों से टेक्स्ट को आसानी से संभाल सकते हैं, जिससे यह आपके दस्तावेज़ प्रसंस्करण टूलकिट में एक मूल्यवान अतिरिक्त बन जाता है।
इससे पहले, हमने C# का उपयोग करके ODT फ़ाइलों से टेक्स्ट निकालने के बारे में विस्तृत गाइड प्रदान की थी। अधिक विस्तृत जानकारी के लिए, कृपया C# का उपयोग करके ODT से पाठ निकालें पर हमारा पूरा ट्यूटोरियल देखें।