كيفية تحويل PDF إلى نص في C #

في هذا البرنامج التعليمي ، نشرح الإجراء خطوة بخطوة لإجراء تحويل المستند باستخدام واحدة من أفضل مكتبات تحويل المستندات وتعلم كيفية ** تحويل PDF إلى Text في C # **. يمكننا تنفيذ وظيفة ** محول PDF إلى نص C # ** بسرعة باستخدام العملية المحددة في هذا الدليل. علاوة على ذلك ، لا تتطلب هذه التعليمات أي برامج إضافية تابعة لجهات خارجية ويمكن تنفيذها على أي نظام تشغيل مثل MS Windows و Linux و Mac OS.

خطوات تحويل PDF إلى نص في C

  1. قم بتثبيت حزمة GroupDocs.Conversion for .NET من NuGet في مشروع .NET لتطبيق وظيفة PDF إلى نص
  2. أضف مرجعًا إلى مساحة الاسم GroupDocs.Conversion لتحويل PDF إلى نص
  3. قم بإنشاء كائن من فئة Converter وقم بتمرير ملف PDF المصدر إلى منشئه
  4. تهيئة فئة WordProcessingConvertOptions وتحديد المعاملات لتخصيص وثيقة النص
  5. أخيرًا ، قم باستدعاء طريقة التحويل لفئة المحول لحفظ PDF كمستند نصي

في هذه النقاط ، يتم بدء فئة المحول لتحميل ملف PDF بعد تكوين المكتبة لتنفيذ إمكانية * C # تحويل PDF إلى نص *. بعد ذلك ، قم بتعيين خصائص لتخصيص ملف نص الإخراج عن طريق تهيئة فئة WordProcessingConvertOptions. في النهاية ، يتم حفظ المستند النصي الناتج على القرص عن طريق استدعاء طريقة التحويل.

كود لتحويل PDF إلى نص في C

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertPdfToTextInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert PDF to Text using C#
{
// Remove the watermark in output PDF document by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source PDF file for conversion to Text
var converterObj = new GroupDocs.Conversion.Converter("sample.pdf");
// Set the conversion options for Text document to customize the output file
WordProcessingConvertOptions options = new WordProcessingConvertOptions {
Format = GroupDocs.Conversion.FileTypes.WordProcessingFileType.Txt
};
// Convert and save the PDF in TXT format
converterObj.Convert("converted.txt", options);
Console.WriteLine("Done");
}
}
}

يتم إنشاء وظيفة * تحويل PDF إلى نص C # * في المقتطف أعلاه باستخدام الإرشادات الموضحة في القسم السابق. لقد استخدمنا بعض استدعاءات API الخاصة بمكتبة تحويل المستندات لتغيير ملف PDF إلى نص. يمكنك أيضًا تحويل مجموعة متنوعة من المستندات إلى تنسيقات نصية بما في ذلك HTML و CSV و DOCX و DWF و EML و ODT و PNG وغيرها الكثير.

لقد ركزنا على عملية تحويل المستند لتنفيذ C # الحصول على نص من وظيفة PDF. نشرنا مؤخرًا مقالًا لتغيير HTML إلى نص في C # ، ألق نظرة على دليل كيفية تحويل HTML إلى نص باستخدام C # لمزيد من المعلومات.

 عربي