Կարդացեք մետատվյալները PDF-ից՝ օգտագործելով C#

PDF ֆայլերի մետատվյալները պարունակում են էական տեղեկություններ փաստաթղթի մասին, ինչպիսիք են անվանումը, հեղինակը, ստեղծման ամսաթիվը, փոփոխման ամսաթիվը, հիմնաբառեր և այլն: Այս մետատվյալների արդյունահանումը կարող է չափազանց օգտակար լինել տարբեր ծրագրերի համար, ներառյալ փաստաթղթերի կառավարման համակարգերը, տվյալների վերլուծությունը և ավտոմատացման առաջադրանքները: Այս հոդվածում մենք կխորանանք, թե ինչպես կարդալ մետատվյալները PDF-ից՝ օգտագործելով C#: Ահա գործընթացի տարանջատումը օրինակ կոդով, որը կօգնի ձեզ հասկանալ, թե ինչպես կարդալ PDF-ի մետատվյալները՝ օգտագործելով C#:

Մետատվյալները PDF-ից C#-ով կարդալու քայլեր

  1. Կարգավորեք ձեր IDE-ն այնպես, որ օգտագործի GroupDocs.Metadata for .NET՝ PDF ֆայլերից մետատվյալներ հանելու համար
  2. Ստեղծեք Metadata օբյեկտ՝ օգտագործելով PDF ֆայլի ֆայլի ուղին՝ որպես դրա կոնստրուկտորի պարամետր
  3. Սահմանել չափորոշիչներ հավաքագրված մետատվյալների տեղեկատվության վավերացման համար
  4. Նշեք պայման՝ Metadata.FindProperties մեթոդի օգտագործման համար
  5. Անցեք յուրաքանչյուր հատկանիշ մեկ առ մեկ

PDF ֆայլերից մետատվյալների դուրսբերումը C#-ի միջոցով ծրագրավորողներին տալիս է արժեքավոր պատկերացումներ փաստաթղթերի հատկությունների վերաբերյալ, ինչպիսիք են վերնագիրը, հեղինակը, ստեղծման ամսաթիվը, փոփոխման ամսաթիվը և հիմնաբառերը: Այս տեղեկատվությունը կարող է կարևոր լինել փաստաթղթերի կառավարման համակարգերի, տվյալների վերլուծության և ավտոմատացված աշխատանքային հոսքերի համար: Դուք կարող եք հետևել վերը նշված հրահանգներին Windows-ի, macOS-ի կամ Linux-ի վրա այնքան ժամանակ, քանի դեռ տեղադրել եք .NET-ը: Կարիք չկա լրացուցիչ ծրագրակազմ տեղադրել՝ PDF-ի մետատվյալները C#*-ով հանելու համար: Երբ ստեղծեք առաջարկվող գրադարանը և համապատասխանաբար կարգավորեք ֆայլերի ուղիները, կարող եք հեշտությամբ ինտեգրել հետևյալ կոդը ձեր նախագծերում առանց որևէ խնդիրների կամ բարդությունների:

Կոդ՝ մետատվյալները PDF-ից կարդալու համար՝ օգտագործելով C#

using GroupDocs.Metadata;
using GroupDocs.Metadata.Common;
using GroupDocs.Metadata.Tagging;
using System.Text.RegularExpressions;
namespace ReadMetadataFromPDFUsingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Metadata library
License lic = new License();
lic.SetLicense(@"GroupDocs.Metadata.lic");
// Pass absolute or relative path of document to Metadata's constructor
using (Metadata metadata = new Metadata(@"input.pdf"))
{
if (metadata.FileFormat != FileFormat.Unknown && !metadata.GetDocumentInfo().IsEncrypted)
{
Console.WriteLine();
// Fetch all metadata properties that fall into a particular category
var properties = metadata.FindProperties(p => p.Tags.Any(t => t.Category == Tags.Content));
Console.WriteLine("The metadata properties describing some characteristics of the file content: title, keywords, language, etc.");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties having a specific type and value
var year = DateTime.Today.Year;
properties = metadata.FindProperties(p => p.Value.Type == MetadataPropertyType.DateTime &&
p.Value.ToStruct(DateTime.MinValue).Year == year);
Console.WriteLine("All datetime properties with the year value equal to the current year");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties whose names match the specified regex
const string pattern = "^author|company|(.+date.*)$";
Regex regex = new Regex(pattern, RegexOptions.IgnoreCase);
properties = metadata.FindProperties(p => regex.IsMatch(p.Name));
Console.WriteLine("All properties whose names match the following regex: {0}", pattern);
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
}
}
}
}
}

Եզրափակելով, այս հոդվածը տրամադրել է համապարփակ ուղեցույց, թե ինչպես ստանալ PDF-ի մետատվյալներ C#* ծրագրավորման մեջ: Օգտագործելով Մետատվյալների գրադարանը՝ մշակողները կարող են արդյունավետ կերպով հանել էական տեղեկատվություն, ինչպիսիք են փաստաթղթի անվանումը, հեղինակը, ստեղծման ամսաթիվը, փոփոխման ամսաթիվը և հիմնաբառերը PDF փաստաթղթերից: C#-ում մետատվյալների արդյունահանման տեխնիկայի ըմբռնումը և օգտագործումը հնարավորություն է տալիս մշակողներին ստեղծել ամուր հավելվածներ փաստաթղթերի կառավարման, տվյալների վերլուծության և ավտոմատացման առաջադրանքների համար: Առաջարկում ենք փորձարկել տարբեր PDF ֆայլեր, և լրացուցիչ մետատվյալների հատկությունների ուսումնասիրությունը կարող է ավելի մեծացնել C# հավելվածներում մետատվյալների արդյունահանման հնարավորությունները:

Մեր նախորդ քննարկման ժամանակ մենք տրամադրեցինք խորը ձեռնարկ C#-ի միջոցով PPTX ֆայլերից մետատվյալներ հանելու վերաբերյալ: Այս թեմայի ավելի մանրակրկիտ ըմբռնման համար խորհուրդ ենք տալիս դիմել մեր ընդարձակ ուղեցույցին, թե ինչպես անել կարդալ մետատվյալները PPTX-ից՝ օգտագործելով C#:

 Հայերեն