في هذا البرنامج التعليمي الإرشادي ، نصف الإجراء خطوة بخطوة ** لاستخراج البيانات الوصفية من PDF باستخدام C # ** باستخدام .NET API لاستخراج بيانات المستند. يوفر هذا الدليل أيضًا إرشادات حول كيفية تكوين المكتبة المطلوبة وعينة من التعليمات البرمجية ** للحصول على البيانات الوصفية من PDF في C # **. فيما يلي الخطوات الأساسية ورمز العمل لاستخراج البيانات الوصفية من المستندات.
خطوات استخراج البيانات الوصفية من PDF باستخدام C
- قم بإعداد الحزمة GroupDocs.Parser for .NET من مدير حزمة NuGet في تطبيق .NET لاستخراج البيانات الوصفية من PDF
- أضف مرجعًا إلى مساحات الأسماء الأساسية لاستخراج البيانات الأولية من مستند PDF
- قم بإنشاء مثيل للفئة Parser وقم بتحميل مستند PDF المدخل
- قم باستدعاء أسلوب GetMetadata واحصل على مجموعة من كائنات بيانات تعريف المستند
- أخيرًا ، كرر خلال المجموعة واحصل على أسماء وقيم البيانات الوصفية
لتنفيذ وظيفة * قراءة البيانات الوصفية بتنسيق PDF C # * ، ما عليك سوى اتباع الخطوات المذكورة أعلاه بالترتيب. بادئ ذي بدء ، قم بتحميل ملف PDF المصدر عن طريق بدء فئة المحلل اللغوي بعد تثبيت الحزمة المطلوبة من NuGet واستيراد مساحات الأسماء الأساسية. بعد ذلك ، تسمح طريقة GetMetadata للشخص بالحصول على كائنات البيانات الوصفية للمستند ثم التكرار على المجموعة لعرض اسم البيانات الوصفية والقيم.
كود لاستخراج البيانات الوصفية من PDF باستخدام C
using System; | |
using System.Collections.Generic; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractMetadataFromPdfUsingCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract metadata from PDF using C# | |
{ | |
// Remove the watermark from output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.pdf")) | |
{ | |
// Extract metadata from the document | |
IEnumerable<MetadataItem> metadata = parser.GetMetadata(); | |
// Check if metadata extraction is supported | |
if (metadata == null) | |
{ | |
Console.WriteLine("Metatada extraction isn't supported"); | |
} | |
// Iterate over metadata items | |
foreach (MetadataItem item in metadata) | |
{ | |
// Print an item name and value | |
Console.WriteLine(string.Format("{0}: {1}", item.Name, item.Value)); | |
} | |
} | |
} | |
} | |
} |
لقد قمنا بتطوير تطبيق * C # read PDF metadata * لإثبات عمل استخراج البيانات الوصفية من ميزة المستند. يتم إنشاء هذا التطبيق عن طريق استهلاك بضع مكالمات API لمكتبة استخراج بيانات المستندات دون إعداد أي برامج إضافية. علاوة على ذلك ، يمكن تنفيذ نموذج التعليمات البرمجية هذا على أي نظام تشغيل مثل MS Windows و Linux و macOS التي تدعم بيئة .NET.