Կարդացեք մետատվյալները DOCX-ից՝ օգտագործելով C#

Այսօրվա թվային դարաշրջանում փաստաթղթերի մեջ ներկառուցված թաքնված տեղեկատվության ըմբռնումը առաջնային է փաստաթղթերի արդյունավետ կառավարման և վերլուծության համար: Փաստաթղթի մետատվյալները, ինչպիսիք են հեղինակությունը, ստեղծման ամսաթիվը և վերանայման պատմությունը, կարող են արժեքավոր պատկերացումներ տալ փաստաթղթի ծագման և էվոլյուցիայի վերաբերյալ: Այս հոդվածում մենք կուսումնասիրենք, թե ինչպես կարելի է կարդալ մետատվյալները DOCX-ից՝ օգտագործելով C# Մետատվյալների գրադարանի հզորությամբ՝ թույլ տալով ծրագրավորողներին ավելի խորանալ իրենց փաստաթղթերի պահեստներում և բարելավել փաստաթղթերի մշակման իրենց աշխատանքային հոսքերը: Հետևելով հիմնական քայլերին և կոդի օրինակին, ցույց են տալիս, թե ինչպես կարելի է կարդալ DOCX-ի մետատվյալները՝ օգտագործելով C#:

Քայլեր՝ DOCX-ից C#-ով մետատվյալները կարդալու համար

  1. Կարգավորեք ձեր IDE-ն՝ օգտագործելու GroupDocs.Metadata for .NET՝ DOCX մետատվյալների տեղեկատվությունը առբերելու համար
  2. Ստեղծեք Metadata դասի օրինակ՝ DOCX ֆայլի ֆայլի ուղին որպես պարամետր փոխանցելով կոնստրուկտորին։
  3. Ստեղծեք պրեդիկատ՝ վերցված մետատվյալների հատկությունները ստուգելու համար
  4. Տրամադրեք պրեդիկատ Metadata.FindProperties մեթոդին
  5. Կրկնել վերցված հատկությունների միջոցով

Անկախ նրանից, թե դա փաստաթղթերի դասակարգման ավտոմատացում է, փաստաթղթերի պահոցներում որոնման գործառույթների իրականացում, թե կազմակերպչական չափանիշներին համապատասխանության ապահովում, C#*-ում DOCX-ի մետատվյալները հանելու ունակությունը բազմաթիվ հնարավորություններ է բացում մշակողների համար: Տրված հրահանգներին հետևելը համատեղելի է լայնորեն օգտագործվող օպերացիոն համակարգերի հետ, ինչպիսիք են Windows-ը, macOS-ը և Linux-ը, քանի դեռ տեղադրված է .NET-ը: Այս ընթացակարգի համար լրացուցիչ ծրագրերի տեղադրում չի պահանջվում: Երբ ստեղծեք առաջարկվող գրադարանը և համապատասխանաբար կարգավորեք ֆայլերի ուղիները, հետևյալ ծածկագիրը ձեր նախագծերում ներառելը պետք է ընթանա սահուն և առանց որևէ խոչընդոտի:

Կոդ՝ DOCX-ից C#-ով մետատվյալները կարդալու համար

using GroupDocs.Metadata;
using GroupDocs.Metadata.Common;
using GroupDocs.Metadata.Tagging;
using System.Text.RegularExpressions;
namespace ReadMetadataFromDOCXUsingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Metadata library
License lic = new License();
lic.SetLicense(@"GroupDocs.Metadata.lic");
// Pass absolute or relative path of document to Metadata's constructor
using (Metadata metadata = new Metadata(@"input.docx"))
{
if (metadata.FileFormat != FileFormat.Unknown && !metadata.GetDocumentInfo().IsEncrypted)
{
Console.WriteLine();
// Fetch all metadata properties that fall into a particular category
var properties = metadata.FindProperties(p => p.Tags.Any(t => t.Category == Tags.Content));
Console.WriteLine("The metadata properties describing some characteristics of the file content: title, keywords, language, etc.");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties having a specific type and value
var year = DateTime.Today.Year;
properties = metadata.FindProperties(p => p.Value.Type == MetadataPropertyType.DateTime &&
p.Value.ToStruct(DateTime.MinValue).Year == year);
Console.WriteLine("All datetime properties with the year value equal to the current year");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties whose names match the specified regex
const string pattern = "^author|company|(.+date.*)$";
Regex regex = new Regex(pattern, RegexOptions.IgnoreCase);
properties = metadata.FindProperties(p => regex.IsMatch(p.Name));
Console.WriteLine("All properties whose names match the following regex: {0}", pattern);
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
}
}
}
}
}

Եզրափակելով, DOCX-ից մետատվյալների ընթերցումը հնարավորություն է տալիս մշակողներին ավելի խորը պատկերացում կազմել իրենց փաստաթղթերի հավաքածուների վերաբերյալ: Հետևելով այս հոդվածում շարադրված քայլերին և օգտվելով տրամադրված կոդի օրինակից՝ դուք կարող եք անխափան ստանալ DOCX-ի մետատվյալներ C#-ում՝ հնարավորություն տալով ավելի լավ կազմակերպել, վերլուծել և կառավարել ձեր փաստաթղթերը: Փորձեք տարբեր մետատվյալների հատկությունների հետ և ուսումնասիրեք գրադարանը՝ C#-ում ձեր փաստաթղթերի մշակման հնարավորություններն ավելի ընդլայնելու համար: Շնորհավորում եմ: Այժմ դուք հմուտ եք դարձել DOCX-ի մետատվյալների արդյունահանման մեջ՝ օգտագործելով C#:

Ավելի վաղ զրույցի ժամանակ մենք առաջարկել էինք C#-ի միջոցով փաստաթղթերի մասին տեղեկատվության առբերման ընդարձակ ձեռնարկ: Այս թեմայի ավելի խորը ընկալման համար խորհուրդ ենք տալիս ծանոթանալ մեր մանրամասն ուղեցույցին, թե ինչպես անել ստանալ փաստաթղթի մասին տեղեկատվություն C#-ի միջոցով:

 Հայերեն