قراءة البيانات الوصفية من PDF باستخدام C#

تحتوي البيانات التعريفية في ملفات PDF على معلومات أساسية حول المستند، مثل العنوان والمؤلف وتاريخ الإنشاء وتاريخ التعديل والكلمات الرئيسية والمزيد. يمكن أن يكون استخراج هذه البيانات التعريفية مفيدًا للغاية لمختلف التطبيقات، بما في ذلك أنظمة إدارة المستندات وتحليل البيانات ومهام التشغيل الآلي. في هذه المقالة، سوف نتعمق في كيفية قراءة البيانات الوصفية من PDF باستخدام C#. فيما يلي تفاصيل العملية باستخدام رمز مثال لمساعدتك على فهم كيفية قراءة البيانات التعريفية لملف PDF باستخدام لغة C#.

خطوات قراءة البيانات الوصفية من PDF باستخدام C#

  1. قم بتكوين IDE الخاص بك لاستخدام GroupDocs.Metadata for .NET لاستخراج البيانات التعريفية من ملفات PDF
  2. قم بإنشاء كائن Metadata باستخدام مسار الملف الخاص بملف PDF كمعلمة لمنشئه
  3. وضع معايير للتحقق من صحة معلومات البيانات الوصفية التي تم جمعها
  4. حدد شرطًا لاستخدام الطريقة Metadata.FindProperties.
  5. قم بالتمرير على كل خاصية واحدة تلو الأخرى

يوفر استخراج البيانات التعريفية من ملفات PDF باستخدام C# للمطورين رؤى قيمة حول خصائص المستند مثل العنوان والمؤلف وتاريخ الإنشاء وتاريخ التعديل والكلمات الرئيسية. يمكن أن تكون هذه المعلومات حاسمة لأنظمة إدارة المستندات، وتحليل البيانات، وسير العمل الآلي. يمكنك اتباع التعليمات المذكورة أعلاه على نظام التشغيل Windows أو macOS أو Linux طالما قمت بتثبيت .NET. ليست هناك حاجة لتثبيت برامج إضافية لاستخراج البيانات التعريفية لملف PDF في لغة C#*. بمجرد إعداد المكتبة الموصى بها وضبط مسارات الملفات وفقًا لذلك، يمكنك بسهولة دمج الكود التالي في مشاريعك دون أي مشاكل أو تعقيدات.

كود لقراءة البيانات الوصفية من PDF باستخدام C#

using GroupDocs.Metadata;
using GroupDocs.Metadata.Common;
using GroupDocs.Metadata.Tagging;
using System.Text.RegularExpressions;
namespace ReadMetadataFromPDFUsingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Metadata library
License lic = new License();
lic.SetLicense(@"GroupDocs.Metadata.lic");
// Pass absolute or relative path of document to Metadata's constructor
using (Metadata metadata = new Metadata(@"input.pdf"))
{
if (metadata.FileFormat != FileFormat.Unknown && !metadata.GetDocumentInfo().IsEncrypted)
{
Console.WriteLine();
// Fetch all metadata properties that fall into a particular category
var properties = metadata.FindProperties(p => p.Tags.Any(t => t.Category == Tags.Content));
Console.WriteLine("The metadata properties describing some characteristics of the file content: title, keywords, language, etc.");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties having a specific type and value
var year = DateTime.Today.Year;
properties = metadata.FindProperties(p => p.Value.Type == MetadataPropertyType.DateTime &&
p.Value.ToStruct(DateTime.MinValue).Year == year);
Console.WriteLine("All datetime properties with the year value equal to the current year");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties whose names match the specified regex
const string pattern = "^author|company|(.+date.*)$";
Regex regex = new Regex(pattern, RegexOptions.IgnoreCase);
properties = metadata.FindProperties(p => regex.IsMatch(p.Name));
Console.WriteLine("All properties whose names match the following regex: {0}", pattern);
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
}
}
}
}
}

في الختام، قدمت هذه المقالة دليلاً شاملاً حول كيفية الحصول على البيانات الوصفية لملف PDF في برمجة C#. من خلال الاستفادة من مكتبة البيانات الوصفية، يمكن للمطورين استخراج المعلومات الأساسية بكفاءة مثل عنوان المستند والمؤلف وتاريخ الإنشاء وتاريخ التعديل والكلمات الرئيسية من مستندات PDF. إن فهم واستخدام تقنيات استخراج البيانات الوصفية في C# يمكّن المطورين من إنشاء تطبيقات قوية لإدارة المستندات وتحليل البيانات ومهام التشغيل الآلي. نقترح عليك تجربة ملفات PDF مختلفة واستكشاف خصائص البيانات التعريفية الإضافية التي يمكن أن تزيد من تعزيز قدرات استخراج البيانات التعريفية في تطبيقات C#.

خلال مناقشتنا السابقة، قدمنا برنامجًا تعليميًا متعمقًا حول استخراج البيانات الوصفية من ملفات PPTX باستخدام لغة C#. للحصول على فهم أكثر شمولاً لهذا الموضوع، نوصي بالرجوع إلى دليلنا الشامل حول كيفية قراءة البيانات الوصفية من PPTX باستخدام C#.

 عربي