Այսօրվա թվային դարաշրջանում փաստաթղթերի մեջ ներկառուցված թաքնված տեղեկատվության ըմբռնումը առաջնային է փաստաթղթերի արդյունավետ կառավարման և վերլուծության համար: Փաստաթղթի մետատվյալները, ինչպիսիք են հեղինակությունը, ստեղծման ամսաթիվը և վերանայման պատմությունը, կարող են արժեքավոր պատկերացումներ տալ փաստաթղթի ծագման և էվոլյուցիայի վերաբերյալ: Այս հոդվածում մենք կուսումնասիրենք, թե ինչպես կարելի է կարդալ մետատվյալները DOCX-ից՝ օգտագործելով C# Մետատվյալների գրադարանի հզորությամբ՝ թույլ տալով ծրագրավորողներին ավելի խորանալ իրենց փաստաթղթերի պահեստներում և բարելավել փաստաթղթերի մշակման իրենց աշխատանքային հոսքերը: Հետևելով հիմնական քայլերին և կոդի օրինակին, ցույց են տալիս, թե ինչպես կարելի է կարդալ DOCX-ի մետատվյալները՝ օգտագործելով C#:
Քայլեր՝ DOCX-ից C#-ով մետատվյալները կարդալու համար
- Կարգավորեք ձեր IDE-ն՝ օգտագործելու GroupDocs.Metadata for .NET՝ DOCX մետատվյալների տեղեկատվությունը առբերելու համար
- Ստեղծեք Metadata դասի օրինակ՝ DOCX ֆայլի ֆայլի ուղին որպես պարամետր փոխանցելով կոնստրուկտորին։
- Ստեղծեք պրեդիկատ՝ վերցված մետատվյալների հատկությունները ստուգելու համար
- Տրամադրեք պրեդիկատ Metadata.FindProperties մեթոդին
- Կրկնել վերցված հատկությունների միջոցով
Անկախ նրանից, թե դա փաստաթղթերի դասակարգման ավտոմատացում է, փաստաթղթերի պահոցներում որոնման գործառույթների իրականացում, թե կազմակերպչական չափանիշներին համապատասխանության ապահովում, C#*-ում DOCX-ի մետատվյալները հանելու ունակությունը բազմաթիվ հնարավորություններ է բացում մշակողների համար: Տրված հրահանգներին հետևելը համատեղելի է լայնորեն օգտագործվող օպերացիոն համակարգերի հետ, ինչպիսիք են Windows-ը, macOS-ը և Linux-ը, քանի դեռ տեղադրված է .NET-ը: Այս ընթացակարգի համար լրացուցիչ ծրագրերի տեղադրում չի պահանջվում: Երբ ստեղծեք առաջարկվող գրադարանը և համապատասխանաբար կարգավորեք ֆայլերի ուղիները, հետևյալ ծածկագիրը ձեր նախագծերում ներառելը պետք է ընթանա սահուն և առանց որևէ խոչընդոտի:
Կոդ՝ DOCX-ից C#-ով մետատվյալները կարդալու համար
using GroupDocs.Metadata; | |
using GroupDocs.Metadata.Common; | |
using GroupDocs.Metadata.Tagging; | |
using System.Text.RegularExpressions; | |
namespace ReadMetadataFromDOCXUsingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Set License to avoid the limitations of Metadata library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Metadata.lic"); | |
// Pass absolute or relative path of document to Metadata's constructor | |
using (Metadata metadata = new Metadata(@"input.docx")) | |
{ | |
if (metadata.FileFormat != FileFormat.Unknown && !metadata.GetDocumentInfo().IsEncrypted) | |
{ | |
Console.WriteLine(); | |
// Fetch all metadata properties that fall into a particular category | |
var properties = metadata.FindProperties(p => p.Tags.Any(t => t.Category == Tags.Content)); | |
Console.WriteLine("The metadata properties describing some characteristics of the file content: title, keywords, language, etc."); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
// Fetch all properties having a specific type and value | |
var year = DateTime.Today.Year; | |
properties = metadata.FindProperties(p => p.Value.Type == MetadataPropertyType.DateTime && | |
p.Value.ToStruct(DateTime.MinValue).Year == year); | |
Console.WriteLine("All datetime properties with the year value equal to the current year"); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
// Fetch all properties whose names match the specified regex | |
const string pattern = "^author|company|(.+date.*)$"; | |
Regex regex = new Regex(pattern, RegexOptions.IgnoreCase); | |
properties = metadata.FindProperties(p => regex.IsMatch(p.Name)); | |
Console.WriteLine("All properties whose names match the following regex: {0}", pattern); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
} | |
} | |
} | |
} | |
} |
Եզրափակելով, DOCX-ից մետատվյալների ընթերցումը հնարավորություն է տալիս մշակողներին ավելի խորը պատկերացում կազմել իրենց փաստաթղթերի հավաքածուների վերաբերյալ: Հետևելով այս հոդվածում շարադրված քայլերին և օգտվելով տրամադրված կոդի օրինակից՝ դուք կարող եք անխափան ստանալ DOCX-ի մետատվյալներ C#-ում՝ հնարավորություն տալով ավելի լավ կազմակերպել, վերլուծել և կառավարել ձեր փաստաթղթերը: Փորձեք տարբեր մետատվյալների հատկությունների հետ և ուսումնասիրեք գրադարանը՝ C#-ում ձեր փաստաթղթերի մշակման հնարավորություններն ավելի ընդլայնելու համար: Շնորհավորում եմ: Այժմ դուք հմուտ եք դարձել DOCX-ի մետատվյալների արդյունահանման մեջ՝ օգտագործելով C#:
Ավելի վաղ զրույցի ժամանակ մենք առաջարկել էինք C#-ի միջոցով փաստաթղթերի մասին տեղեկատվության առբերման ընդարձակ ձեռնարկ: Այս թեմայի ավելի խորը ընկալման համար խորհուրդ ենք տալիս ծանոթանալ մեր մանրամասն ուղեցույցին, թե ինչպես անել ստանալ փաստաթղթի մասին տեղեկատվություն C#-ի միջոցով: