Im heutigen digitalen Zeitalter ist das Verständnis der in Dokumenten eingebetteten verborgenen Informationen für eine effiziente Dokumentenverwaltung und -analyse von größter Bedeutung. Dokumentmetadaten wie Urheberschaft, Erstellungsdatum und Revisionsverlauf können wertvolle Einblicke in den Ursprung und die Entwicklung des Dokuments liefern. In diesem Artikel erfahren Sie, wie Sie mithilfe von C# mithilfe der Metadatenbibliothek Metadaten aus DOCX lesen, sodass Entwickler tiefer in ihre Dokumentrepositorys eintauchen und ihre Dokumentverarbeitungsworkflows verbessern können. Die folgenden wichtigen Schritte und das Codebeispiel zeigen, wie man Metadaten von DOCX mit C# liest.
Schritte zum Lesen von Metadaten aus DOCX mit C#
- Richten Sie Ihre IDE so ein, dass sie GroupDocs.Metadata for .NET zum Abrufen von DOCX-Metadateninformationen verwendet
- Erstellen Sie eine Instanz der Klasse Metadata und übergeben Sie den Dateipfad der DOCX-Datei als Parameter an den Konstruktor
- Erstellen Sie ein Prädikat, um alle abgerufenen Metadateneigenschaften zu überprüfen
- Geben Sie ein Prädikat für die Methode Metadata.FindProperties an
- Durchlaufen Sie die abgerufenen Eigenschaften
Ob es darum geht, die Kategorisierung von Dokumenten zu automatisieren, Suchfunktionen in Dokument-Repositories zu implementieren oder die Einhaltung von Organisationsstandards sicherzustellen, die Möglichkeit, Metadaten von DOCX in C# zu extrahieren, eröffnet Entwicklern eine Fülle von Möglichkeiten. Die Einhaltung der angegebenen Anweisungen ist mit gängigen Betriebssystemen wie Windows, macOS und Linux kompatibel, sofern .NET installiert ist. Für dieses Verfahren sind keine zusätzlichen Softwareinstallationen erforderlich. Sobald Sie die empfohlene Bibliothek eingerichtet und die Dateipfade entsprechend angepasst haben, sollte die Einbindung des folgenden Codes in Ihre Projekte reibungslos und ohne Probleme verlaufen.
Code zum Lesen von Metadaten aus DOCX mit C#
using GroupDocs.Metadata; | |
using GroupDocs.Metadata.Common; | |
using GroupDocs.Metadata.Tagging; | |
using System.Text.RegularExpressions; | |
namespace ReadMetadataFromDOCXUsingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Set License to avoid the limitations of Metadata library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Metadata.lic"); | |
// Pass absolute or relative path of document to Metadata's constructor | |
using (Metadata metadata = new Metadata(@"input.docx")) | |
{ | |
if (metadata.FileFormat != FileFormat.Unknown && !metadata.GetDocumentInfo().IsEncrypted) | |
{ | |
Console.WriteLine(); | |
// Fetch all metadata properties that fall into a particular category | |
var properties = metadata.FindProperties(p => p.Tags.Any(t => t.Category == Tags.Content)); | |
Console.WriteLine("The metadata properties describing some characteristics of the file content: title, keywords, language, etc."); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
// Fetch all properties having a specific type and value | |
var year = DateTime.Today.Year; | |
properties = metadata.FindProperties(p => p.Value.Type == MetadataPropertyType.DateTime && | |
p.Value.ToStruct(DateTime.MinValue).Year == year); | |
Console.WriteLine("All datetime properties with the year value equal to the current year"); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
// Fetch all properties whose names match the specified regex | |
const string pattern = "^author|company|(.+date.*)$"; | |
Regex regex = new Regex(pattern, RegexOptions.IgnoreCase); | |
properties = metadata.FindProperties(p => regex.IsMatch(p.Name)); | |
Console.WriteLine("All properties whose names match the following regex: {0}", pattern); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
} | |
} | |
} | |
} | |
} |
Zusammenfassend lässt sich sagen, dass Entwickler durch das Lesen von Metadaten aus DOCX tiefere Einblicke in ihre Dokumentensammlungen gewinnen können. Indem Sie die in diesem Artikel beschriebenen Schritte befolgen und das bereitgestellte Codebeispiel nutzen, können Sie nahtlos Metadaten von DOCX in C# abrufen und so eine bessere Organisation, Analyse und Verwaltung Ihrer Dokumente ermöglichen. Experimentieren Sie mit verschiedenen Metadateneigenschaften und erkunden Sie die Bibliothek, um Ihre Dokumentverarbeitungsmöglichkeiten in C# weiter zu erweitern. Glückwunsch! Sie beherrschen nun das Extrahieren von DOCX-Metadaten mit C#.
In einem früheren Gespräch haben wir ein ausführliches Tutorial zum Abrufen von Dokumentinformationen mit C# angeboten. Für ein tieferes Verständnis dieses Themas empfehlen wir Ihnen, unseren ausführlichen Leitfaden zu Dokumentinformationen mit C# abrufen zu konsultieren.