C# का उपयोग करके DOCM से टेक्स्ट निकालें

Microsoft Word का DOCM फ़ाइल फ़ॉर्मेट एक उन्नत दस्तावेज़ फ़ॉर्मेट है जिसमें मैक्रोज़ शामिल हैं, जो इसे दस्तावेज़ों के भीतर दोहराए जाने वाले कार्यों को स्वचालित करने के लिए एक बहुमुखी उपकरण बनाता है। डेवलपर्स के लिए, ऐसे परिदृश्य हो सकते हैं जहाँ DOCM फ़ाइलों से टेक्स्ट निकालना आवश्यक है, चाहे दस्तावेज़ प्रसंस्करण, डेटा विश्लेषण या सामग्री प्रबंधन उद्देश्यों के लिए। इस लेख में, हम यह पता लगाएंगे कि C# का उपयोग करके DOCM से टेक्स्ट कैसे निकाला जाए। प्रोग्रामेटिक सेटिंग में इन फ़ाइलों के साथ काम करते समय, C# में DOCM से टेक्स्ट निकालना इंडेक्सिंग, सामग्री विश्लेषण या दस्तावेज़ रूपांतरण जैसे विभिन्न अनुप्रयोगों के लिए उपयोगी हो सकता है। नीचे दिए गए निर्देश प्रक्रिया का विवरण देते हैं, जिससे टेक्स्ट निष्कर्षण कार्यक्षमता का निर्बाध एकीकरण सुनिश्चित होता है।

C# का उपयोग करके DOCM से टेक्स्ट निकालने के चरण

  1. अपने विकास परिवेश को सेट अप करके शुरू करें। GroupDocs.Parser for .NET लाइब्रेरी जोड़ें, जो DOCM फ़ाइलों से टेक्स्ट निकालना आसान बनाता है
  2. आरंभीकरण के दौरान अपनी DOCM फ़ाइल का पथ प्रदान करके एक Parser ऑब्जेक्ट बनाएँ
  3. TextReader प्राप्त करने के लिए Parser ऑब्जेक्ट पर GetText विधि का उपयोग करें, जो आपको DOCM फ़ाइल से पाठ तक पहुंचने की अनुमति देता है
  4. अंत में, DOCM फ़ाइल से सभी पाठ को पढ़ने के लिए TextReader ऑब्जेक्ट पर ReadToEnd विधि को कॉल करें

एक बार जब आप उल्लिखित चरणों का पालन कर लेंगे, तो आप सफलतापूर्वक टेक्स्ट निकालने की प्रक्रिया सेट कर लेंगे। C# में DOCM टेक्स्ट निष्कर्षण की विधि न केवल सरल है, बल्कि अत्यधिक कुशल भी है, जो आपकी परियोजनाओं में सहज एकीकरण की अनुमति देती है। प्रदान किए गए कोड और दृष्टिकोण का लाभ उठाकर, आप DOCM फ़ाइलों से टेक्स्ट डेटा को प्रभावी ढंग से प्रबंधित और हेरफेर कर सकते हैं, जिससे आपके एप्लिकेशन की कार्यक्षमता और प्रदर्शन में वृद्धि होगी। इसके अलावा, आप .NET से परे किसी भी अतिरिक्त सॉफ़्टवेयर की आवश्यकता के बिना Windows, macOS और Linux ऑपरेटिंग सिस्टम पर इस प्रक्रिया को कुशलतापूर्वक निष्पादित कर सकते हैं।

C# का उपयोग करके DOCM से टेक्स्ट निकालने का कोड

using GroupDocs.Parser;
using GroupDocs.Parser.Options;
using System;
using System.IO;
namespace ExtractTextfromDOCMusingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Parser library
License lic = new License();
lic.SetLicense(@"GroupDocs.Parser.lic");
// Instantiate the Parser class
using (Parser parser = new Parser("input.docm"))
{
// Retrieve formatted text into the reader
using (TextReader reader = parser.GetFormattedText(
new FormattedTextOptions(FormattedTextMode.Html)))
{
// Output the formatted text from the document
// If formatted text extraction is not supported,
// the reader will be null
Console.WriteLine(reader == null ?
"Formatted text extraction isn't supported"
: reader.ReadToEnd());
Console.ReadLine();
}
}
}
}
}

यह गाइड आपको अपने C# प्रोजेक्ट में DOCM फ़ाइलों से टेक्स्ट एक्सट्रैक्शन को लागू करने के लिए आवश्यक ज्ञान से लैस करता है, जिससे आपके दस्तावेज़ वर्कफ़्लो की दक्षता में वृद्धि होती है। निष्कर्ष में, इस गाइड ने C# DOCM से टेक्स्ट पढ़ने के लिए एक स्पष्ट मार्ग प्रदान किया है। यह दृष्टिकोण सुनिश्चित करता है कि आप DOCM फ़ाइलों को आसानी से संभाल सकते हैं, जिससे यह आपके दस्तावेज़ प्रसंस्करण टूलकिट में एक मूल्यवान अतिरिक्त बन जाता है। चाहे आप डेटा एक्सट्रैक्शन, कंटेंट एनालिसिस या रिपोर्ट जनरेशन पर काम कर रहे हों, इस प्रक्रिया में महारत हासिल करने से टेक्स्ट डेटा को कुशलतापूर्वक प्रबंधित करने और उपयोग करने की आपकी क्षमता बढ़ेगी। एक बार जब आप सुझाई गई लाइब्रेरी को इंस्टॉल कर लेते हैं और फ़ाइल पथ को सही तरीके से सेट कर लेते हैं, तो दिए गए कोड को अपनी परियोजनाओं में एकीकृत करना आसान हो जाएगा।

इससे पहले, हमने C# का उपयोग करके MHTML फ़ाइलों से टेक्स्ट निकालने के तरीके पर एक गाइड साझा की थी। अधिक विस्तृत विवरण के लिए, C# का उपयोग करके MHTML से पाठ निकालें पर हमारा पूरा ट्यूटोरियल देखें।

 हिन्दी