U današnjem digitalnom dobu, razumijevanje skrivenih informacija ugrađenih u dokumente najvažnije je za učinkovito upravljanje i analizu dokumenata. Metapodaci dokumenta, poput autorstva, datuma stvaranja i povijesti revizija, mogu pružiti dragocjene uvide u podrijetlo i razvoj dokumenta. U ovom ćemo članku istražiti kako čitati metapodatke s DOCX koristeći C# sa snagom biblioteke metapodataka, omogućujući razvojnim programerima da dublje zađu u svoja spremišta dokumenata i poboljšaju svoje tijekove obrade dokumenata. Sljedeći ključni koraci i primjer koda pokazuju kako čitati metapodatke DOCX-a pomoću C#.
Koraci za čitanje metapodataka iz DOCX-a pomoću C#
- Postavite svoj IDE da koristi GroupDocs.Metadata for .NET za dohvaćanje DOCX metapodataka
- Napravite instancu klase Metadata, prosljeđujući put datoteke DOCX datoteke kao parametar konstruktoru
- Stvorite predikat za pregled svih dohvaćenih svojstava metapodataka
- Navedite predikat za metodu Metadata.FindProperties
- Iterirajte kroz dohvaćena svojstva
Bilo da se radi o automatizaciji kategorizacije dokumenata, implementaciji funkcija pretraživanja unutar repozitorija dokumenata ili osiguravanju usklađenosti s organizacijskim standardima, mogućnost ekstrahiranja metapodataka DOCX-a u C# otvara mnoštvo mogućnosti za programere. Pridržavanje danih uputa kompatibilno je s široko korištenim operativnim sustavima kao što su Windows, macOS i Linux, sve dok je instaliran .NET. Za ovaj postupak nisu potrebne dodatne instalacije softvera. Nakon što postavite preporučenu biblioteku i u skladu s tim prilagodite staze datoteka, uključivanje sljedećeg koda u vaše projekte trebalo bi teći glatko i bez ikakvih zastoja.
Kod za čitanje metapodataka iz DOCX-a pomoću C#
using GroupDocs.Metadata; | |
using GroupDocs.Metadata.Common; | |
using GroupDocs.Metadata.Tagging; | |
using System.Text.RegularExpressions; | |
namespace ReadMetadataFromDOCXUsingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Set License to avoid the limitations of Metadata library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Metadata.lic"); | |
// Pass absolute or relative path of document to Metadata's constructor | |
using (Metadata metadata = new Metadata(@"input.docx")) | |
{ | |
if (metadata.FileFormat != FileFormat.Unknown && !metadata.GetDocumentInfo().IsEncrypted) | |
{ | |
Console.WriteLine(); | |
// Fetch all metadata properties that fall into a particular category | |
var properties = metadata.FindProperties(p => p.Tags.Any(t => t.Category == Tags.Content)); | |
Console.WriteLine("The metadata properties describing some characteristics of the file content: title, keywords, language, etc."); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
// Fetch all properties having a specific type and value | |
var year = DateTime.Today.Year; | |
properties = metadata.FindProperties(p => p.Value.Type == MetadataPropertyType.DateTime && | |
p.Value.ToStruct(DateTime.MinValue).Year == year); | |
Console.WriteLine("All datetime properties with the year value equal to the current year"); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
// Fetch all properties whose names match the specified regex | |
const string pattern = "^author|company|(.+date.*)$"; | |
Regex regex = new Regex(pattern, RegexOptions.IgnoreCase); | |
properties = metadata.FindProperties(p => regex.IsMatch(p.Name)); | |
Console.WriteLine("All properties whose names match the following regex: {0}", pattern); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
} | |
} | |
} | |
} | |
} |
Zaključno, čitanje metapodataka iz DOCX-a omogućuje programerima da steknu dublji uvid u svoje zbirke dokumenata. Slijedeći korake navedene u ovom članku i koristeći navedeni primjer koda, možete neprimjetno dobiti metapodatke DOCX-a u C#, omogućujući bolju organizaciju, analizu i upravljanje vašim dokumentima. Eksperimentirajte s različitim svojstvima metapodataka i istražite biblioteku kako biste dodatno proširili svoje mogućnosti obrade dokumenata u C#. Čestitamo! Sada ste postali vješti u izdvajanju DOCX metapodataka pomoću C#.
U ranijem smo razgovoru ponudili opsežan vodič o dohvaćanju informacija o dokumentima pomoću C#. Za dublje razumijevanje ove teme, savjetujemo da pogledate naš detaljan vodič o tome kako dobiti informacije o dokumentu koristeći C#.