استخراج النص من PPT باستخدام C#

في العصر الرقمي الحالي، أصبحت إدارة المعلومات واستخراجها من ملفات العروض التقديمية مهمة شائعة للمطورين ومحللي البيانات. يمكن أن تحتوي عروض PowerPoint التقديمية، والتي غالبًا ما يتم حفظها بتنسيق PPT، على بيانات نصية قيمة تحتاج إلى استخراجها للتحليل أو التحويل أو التكامل في أنظمة أخرى. سترشدك هذه المقالة خلال عملية كيفية استخراج النص من PPT باستخدام C#، والاستفادة من مكتبة Parser القوية. تُستخدم عروض PowerPoint التقديمية على نطاق واسع لتقديم المعلومات بتنسيق مرئي. ومع ذلك، هناك أوقات تحتاج فيها إلى استخراج نص من هذه العروض التقديمية لمزيد من المعالجة أو التحليل. دعنا نتحقق من خطوات استخراج النص من PPT باستخدام C#.

خطوات استخراج النص من PPT باستخدام C#

  1. قم بإعداد بيئة التطوير الخاصة بك عن طريق إضافة GroupDocs.Parser for .NET، الذي يتيح لك استخراج النص من ملفات PPT
  2. إنشاء كائن Parser عن طريق تحديد مسار ملف PPT في المنشئ الخاص به
  3. استخدم طريقة GetText الخاصة بكائن Parser للحصول على TextReader
  4. استدعاء طريقة ReadToEnd على TextReader لقراءة كل النص من ملف PPT

للبدء، تحتاج إلى إعداد بيئة التطوير الخاصة بك لاستخراج النص من ملفات PPT. الخطوة الأولى هي دمج مكتبة Parser في مشروع .NET الخاص بك. توفر هذه المكتبة أدوات شاملة لتحليل المستندات، بما في ذلك دعم ملفات PowerPoint. تأكد من تثبيت .NET على نظامك، وأضف مكتبة Parser إلى مشروعك من خلال NuGet أو عن طريق الرجوع إلى المكتبة يدويًا. الإجراءات الموضحة أعلاه متوافقة مع أنظمة التشغيل Windows وmacOS وLinux، ولا تتطلب أي برامج إضافية بخلاف ما هو مضمن بالفعل مع هذه الأنظمة الأساسية. فيما يلي رمز العينة لاستخراج نص PPT بلغة C#.

كود استخراج النص من PPT باستخدام C#

using System;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Options;
namespace ExtractTextfromPPTusingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Apply the license to remove the limitations of the Parser library
License lic = new License();
lic.SetLicense(@"GroupDocs.Parser.lic");
// Instantiate the Parser class
using (Parser parser = new Parser("input.ppt"))
{
// Retrieve formatted text into the reader
using (TextReader reader = parser.GetFormattedText(
new FormattedTextOptions(FormattedTextMode.Html)))
{
// Output the formatted text from the document
// If formatted text extraction is not supported,
// the reader will be null
Console.WriteLine(reader == null ?
"Formatted text extraction isn't supported"
: reader.ReadToEnd());
Console.ReadLine();
}
}
}
}
}

باستخدام الكود أعلاه، يمكنك استرداد البيانات النصية والاستفادة منها بكفاءة من عروض PowerPoint. لا يوفر هذا النهج الوقت فحسب، بل يعزز أيضًا قدرتك على إدارة ومعالجة محتوى العرض التقديمي برمجيًا. سواء كنت تقوم بتطوير أداة لتحليل محتوى العرض التقديمي، أو تحويل العروض التقديمية إلى تنسيقات مختلفة، أو ببساطة أرشفة بيانات نصية، فإن استخراج النص من ملفات PPT برمجيًا يمكن أن يبسط سير عملك. بمجرد إعداد المكتبة الموصى بها وتعديل مسارات الملفات، يجب أن يكون دمج الكود المقدم في مشاريعك أمرًا سهلاً. عمل رائع! لقد أتقنت عملية قراءة النص من PPT بلغة C#.

في وقت سابق، شاركنا دليلاً شاملاً حول استخراج النص من ملفات DOC باستخدام C#. للحصول على استكشاف متعمق، يرجى الرجوع إلى البرنامج التعليمي الكامل الخاص بنا حول كيفية استخراج النص من DOC باستخدام C#.

 عربي