كيفية استخراج البيانات الوصفية من PDF باستخدام C #

في هذا البرنامج التعليمي الإرشادي ، نصف الإجراء خطوة بخطوة ** لاستخراج البيانات الوصفية من PDF باستخدام C # ** باستخدام .NET API لاستخراج بيانات المستند. يوفر هذا الدليل أيضًا إرشادات حول كيفية تكوين المكتبة المطلوبة وعينة من التعليمات البرمجية ** للحصول على البيانات الوصفية من PDF في C # **. فيما يلي الخطوات الأساسية ورمز العمل لاستخراج البيانات الوصفية من المستندات.

خطوات استخراج البيانات الوصفية من PDF باستخدام C

  1. قم بإعداد الحزمة GroupDocs.Parser for .NET من مدير حزمة NuGet في تطبيق .NET لاستخراج البيانات الوصفية من PDF
  2. أضف مرجعًا إلى مساحات الأسماء الأساسية لاستخراج البيانات الأولية من مستند PDF
  3. قم بإنشاء مثيل للفئة Parser وقم بتحميل مستند PDF المدخل
  4. قم باستدعاء أسلوب GetMetadata واحصل على مجموعة من كائنات بيانات تعريف المستند
  5. أخيرًا ، كرر خلال المجموعة واحصل على أسماء وقيم البيانات الوصفية

لتنفيذ وظيفة * قراءة البيانات الوصفية بتنسيق PDF C # * ، ما عليك سوى اتباع الخطوات المذكورة أعلاه بالترتيب. بادئ ذي بدء ، قم بتحميل ملف PDF المصدر عن طريق بدء فئة المحلل اللغوي بعد تثبيت الحزمة المطلوبة من NuGet واستيراد مساحات الأسماء الأساسية. بعد ذلك ، تسمح طريقة GetMetadata للشخص بالحصول على كائنات البيانات الوصفية للمستند ثم التكرار على المجموعة لعرض اسم البيانات الوصفية والقيم.

كود لاستخراج البيانات الوصفية من PDF باستخدام C

using System;
using System.Collections.Generic;
using GroupDocs.Parser;
using GroupDocs.Parser.Data;
namespace ExtractMetadataFromPdfUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to extract metadata from PDF using C#
{
// Remove the watermark from output
string licensePath = "GroupDocs.Parser.lic";
GroupDocs.Parser.License lic = new GroupDocs.Parser.License();
lic.SetLicense(licensePath);
// Create an instance of Parser class
using (Parser parser = new Parser("sample.pdf"))
{
// Extract metadata from the document
IEnumerable<MetadataItem> metadata = parser.GetMetadata();
// Check if metadata extraction is supported
if (metadata == null)
{
Console.WriteLine("Metatada extraction isn't supported");
}
// Iterate over metadata items
foreach (MetadataItem item in metadata)
{
// Print an item name and value
Console.WriteLine(string.Format("{0}: {1}", item.Name, item.Value));
}
}
}
}
}

لقد قمنا بتطوير تطبيق * C # read PDF metadata * لإثبات عمل استخراج البيانات الوصفية من ميزة المستند. يتم إنشاء هذا التطبيق عن طريق استهلاك بضع مكالمات API لمكتبة استخراج بيانات المستندات دون إعداد أي برامج إضافية. علاوة على ذلك ، يمكن تنفيذ نموذج التعليمات البرمجية هذا على أي نظام تشغيل مثل MS Windows و Linux و macOS التي تدعم بيئة .NET.

 عربي