Odczyt metadanych z DOCX przy użyciu C#

W dzisiejszej epoce cyfrowej zrozumienie ukrytych informacji zawartych w dokumentach ma kluczowe znaczenie dla skutecznego zarządzania dokumentami i ich analizy. Metadane dokumentu, takie jak autorstwo, data utworzenia i historia wersji, mogą dostarczyć cennych informacji na temat pochodzenia i ewolucji dokumentu. W tym artykule przyjrzymy się, jak odczytywać metadane z DOCX przy użyciu języka C# i możliwości biblioteki metadanych, umożliwiając programistom głębsze zagłębianie się w repozytoria dokumentów i usprawnianie przepływów pracy związanych z przetwarzaniem dokumentów. Poniższe kluczowe kroki i przykładowy kod pokazują, jak odczytać metadane DOCX przy użyciu języka C#.

Kroki, aby odczytać metadane z DOCX przy użyciu C#

  1. Skonfiguruj swoje IDE, aby używać GroupDocs.Metadata for .NET do pobierania informacji o metadanych DOCX
  2. Utwórz instancję klasy Metadata, przekazując ścieżkę pliku DOCX jako parametr do konstruktora
  3. Utwórz predykat, aby sprawdzić wszystkie pobrane właściwości metadanych
  4. Podaj predykat dla metody Metadata.FindProperties
  5. Iteruj po pobranych właściwościach

Niezależnie od tego, czy chodzi o automatyzację kategoryzacji dokumentów, wdrażanie funkcji wyszukiwania w repozytoriach dokumentów, czy zapewnienie zgodności ze standardami organizacyjnymi, możliwość wyodrębniania metadanych DOCX w języku C# otwiera mnóstwo możliwości dla programistów. Postępowanie zgodnie z podanymi instrukcjami jest zgodne z powszechnie używanymi systemami operacyjnymi, takimi jak Windows, macOS i Linux, o ile zainstalowana jest platforma .NET. Do tej procedury nie jest wymagana żadna dodatkowa instalacja oprogramowania. Po skonfigurowaniu zalecanej biblioteki i odpowiednim dostosowaniu ścieżek plików, włączenie poniższego kodu do projektów powinno przebiegać sprawnie i bez żadnych problemów.

Kod do odczytu metadanych z DOCX przy użyciu C#

using GroupDocs.Metadata;
using GroupDocs.Metadata.Common;
using GroupDocs.Metadata.Tagging;
using System.Text.RegularExpressions;
namespace ReadMetadataFromDOCXUsingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Metadata library
License lic = new License();
lic.SetLicense(@"GroupDocs.Metadata.lic");
// Pass absolute or relative path of document to Metadata's constructor
using (Metadata metadata = new Metadata(@"input.docx"))
{
if (metadata.FileFormat != FileFormat.Unknown && !metadata.GetDocumentInfo().IsEncrypted)
{
Console.WriteLine();
// Fetch all metadata properties that fall into a particular category
var properties = metadata.FindProperties(p => p.Tags.Any(t => t.Category == Tags.Content));
Console.WriteLine("The metadata properties describing some characteristics of the file content: title, keywords, language, etc.");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties having a specific type and value
var year = DateTime.Today.Year;
properties = metadata.FindProperties(p => p.Value.Type == MetadataPropertyType.DateTime &&
p.Value.ToStruct(DateTime.MinValue).Year == year);
Console.WriteLine("All datetime properties with the year value equal to the current year");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties whose names match the specified regex
const string pattern = "^author|company|(.+date.*)$";
Regex regex = new Regex(pattern, RegexOptions.IgnoreCase);
properties = metadata.FindProperties(p => regex.IsMatch(p.Name));
Console.WriteLine("All properties whose names match the following regex: {0}", pattern);
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
}
}
}
}
}

Podsumowując, czytanie metadanych z DOCX umożliwia programistom uzyskanie głębszego wglądu w swoje zbiory dokumentów. Wykonując kroki opisane w tym artykule i korzystając z podanego przykładowego kodu, możesz bezproblemowo uzyskać metadane DOCX w języku C#, umożliwiając lepszą organizację, analizę i zarządzanie dokumentami. Eksperymentuj z różnymi właściwościami metadanych i eksploruj bibliotekę, aby jeszcze bardziej rozszerzyć możliwości przetwarzania dokumentów w języku C#. Gratulacje! Osiągnąłeś już biegłość w wyodrębnianiu metadanych DOCX przy użyciu języka C#.

We wcześniejszej rozmowie zaoferowaliśmy obszerny samouczek dotyczący pobierania informacji o dokumentach przy użyciu języka C#. Aby lepiej zrozumieć ten temat, zalecamy zapoznanie się z naszym szczegółowym przewodnikiem dotyczącym uzyskać informacje o dokumencie za pomocą C#.

 Polski