Čitajte metapodatke iz DOCX-a koristeći C#

U današnjem digitalnom dobu, razumijevanje skrivenih informacija ugrađenih u dokumente najvažnije je za učinkovito upravljanje i analizu dokumenata. Metapodaci dokumenta, poput autorstva, datuma stvaranja i povijesti revizija, mogu pružiti dragocjene uvide u podrijetlo i razvoj dokumenta. U ovom ćemo članku istražiti kako čitati metapodatke s DOCX koristeći C# sa snagom biblioteke metapodataka, omogućujući razvojnim programerima da dublje zađu u svoja spremišta dokumenata i poboljšaju svoje tijekove obrade dokumenata. Sljedeći ključni koraci i primjer koda pokazuju kako čitati metapodatke DOCX-a pomoću C#.

Koraci za čitanje metapodataka iz DOCX-a pomoću C#

  1. Postavite svoj IDE da koristi GroupDocs.Metadata for .NET za dohvaćanje DOCX metapodataka
  2. Napravite instancu klase Metadata, prosljeđujući put datoteke DOCX datoteke kao parametar konstruktoru
  3. Stvorite predikat za pregled svih dohvaćenih svojstava metapodataka
  4. Navedite predikat za metodu Metadata.FindProperties
  5. Iterirajte kroz dohvaćena svojstva

Bilo da se radi o automatizaciji kategorizacije dokumenata, implementaciji funkcija pretraživanja unutar repozitorija dokumenata ili osiguravanju usklađenosti s organizacijskim standardima, mogućnost ekstrahiranja metapodataka DOCX-a u C# otvara mnoštvo mogućnosti za programere. Pridržavanje danih uputa kompatibilno je s široko korištenim operativnim sustavima kao što su Windows, macOS i Linux, sve dok je instaliran .NET. Za ovaj postupak nisu potrebne dodatne instalacije softvera. Nakon što postavite preporučenu biblioteku i u skladu s tim prilagodite staze datoteka, uključivanje sljedećeg koda u vaše projekte trebalo bi teći glatko i bez ikakvih zastoja.

Kod za čitanje metapodataka iz DOCX-a pomoću C#

using GroupDocs.Metadata;
using GroupDocs.Metadata.Common;
using GroupDocs.Metadata.Tagging;
using System.Text.RegularExpressions;
namespace ReadMetadataFromDOCXUsingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Metadata library
License lic = new License();
lic.SetLicense(@"GroupDocs.Metadata.lic");
// Pass absolute or relative path of document to Metadata's constructor
using (Metadata metadata = new Metadata(@"input.docx"))
{
if (metadata.FileFormat != FileFormat.Unknown && !metadata.GetDocumentInfo().IsEncrypted)
{
Console.WriteLine();
// Fetch all metadata properties that fall into a particular category
var properties = metadata.FindProperties(p => p.Tags.Any(t => t.Category == Tags.Content));
Console.WriteLine("The metadata properties describing some characteristics of the file content: title, keywords, language, etc.");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties having a specific type and value
var year = DateTime.Today.Year;
properties = metadata.FindProperties(p => p.Value.Type == MetadataPropertyType.DateTime &&
p.Value.ToStruct(DateTime.MinValue).Year == year);
Console.WriteLine("All datetime properties with the year value equal to the current year");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties whose names match the specified regex
const string pattern = "^author|company|(.+date.*)$";
Regex regex = new Regex(pattern, RegexOptions.IgnoreCase);
properties = metadata.FindProperties(p => regex.IsMatch(p.Name));
Console.WriteLine("All properties whose names match the following regex: {0}", pattern);
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
}
}
}
}
}

Zaključno, čitanje metapodataka iz DOCX-a omogućuje programerima da steknu dublji uvid u svoje zbirke dokumenata. Slijedeći korake navedene u ovom članku i koristeći navedeni primjer koda, možete neprimjetno dobiti metapodatke DOCX-a u C#, omogućujući bolju organizaciju, analizu i upravljanje vašim dokumentima. Eksperimentirajte s različitim svojstvima metapodataka i istražite biblioteku kako biste dodatno proširili svoje mogućnosti obrade dokumenata u C#. Čestitamo! Sada ste postali vješti u izdvajanju DOCX metapodataka pomoću C#.

U ranijem smo razgovoru ponudili opsežan vodič o dohvaćanju informacija o dokumentima pomoću C#. Za dublje razumijevanje ove teme, savjetujemo da pogledate naš detaljan vodič o tome kako dobiti informacije o dokumentu koristeći C#.

 Hrvatski