Questo articolo fornisce istruzioni dettagliate su come estrarre i metadati dal documento Word in C# con poche semplici chiamate API. Puoi anche trovare un codice di esempio funzionante per ottenere i metadati di Word usando C# in questo post. Il flusso di lavoro descritto in questa guida non dipende da nessun altro strumento di terze parti e può essere seguito su uno qualsiasi dei sistemi operativi più diffusi come Windows, macOS e Linux che supportano un ambiente .NET.
Passaggi per estrarre i metadati dal documento di Word in C#
- Imposta il pacchetto GroupDocs.Parser for .NET dal gestore pacchetti NuGet nel progetto .NET per estrarre i metadati dal documento Word
- Aggiungi un riferimento agli spazi dei nomi necessari per l’estrazione dei metadati dal file Word
- Crea un’istanza della classe Parser per caricare il file DOCX di input
- Richiamare il metodo GetMetadata della classe Parser per ottenere la raccolta di metadati
- Infine, itera sulla raccolta per ottenere il nome e il valore dei metadati
Il flusso di lavoro di cui sopra consente di creare rapidamente la capacità di ottenere un documento Word di metadati in C#. È possibile inizializzare il processo di estrazione dei metadati di Word impostando il pacchetto richiesto e includendo lo spazio dei nomi necessario nel codice. Una volta terminato, è necessario caricare il file DOC o DOCX inizializzando la classe Parser. Nei due passaggi successivi, devi chiamare il metodo GetMetadata per ottenere la raccolta dei metadati e quindi ripeterla per un’ulteriore elaborazione.
Codice per estrarre metadati da documenti Word in C#
using System; | |
using System.Collections.Generic; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractMetadataFromWordDocumentInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract Metadata from Word using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.docx")) | |
{ | |
// Extract metadata from the document | |
IEnumerable<MetadataItem> metadata = parser.GetMetadata(); | |
// Check if metadata extraction is supported | |
if (metadata == null) | |
{ | |
Console.WriteLine("Metatada extraction isn't supported"); | |
} | |
// Iterate over metadata items | |
foreach (MetadataItem item in metadata) | |
{ | |
// Print an item name and value | |
Console.WriteLine(string.Format("{0}: {1}", item.Name, item.Value)); | |
} | |
} | |
} | |
} | |
} |
L’applicazione C# metadata Word document è stata sviluppata a scopo dimostrativo utilizzando le istruzioni spiegate nella sezione precedente. Abbiamo scritto poche righe di codice e consumato alcune chiamate API per l’estrazione dei metadati da un file Word. Inoltre, puoi estrarre facilmente i metadati da altri formati di documenti come DOC, DOCX, RTF, XLSX, PDF, PPTX, MSG, EML e molti altri con una piccola modifica di questo codice di esempio.
Abbiamo discusso le istruzioni dettagliate per estrarre i metadati dal documento Word utilizzando C# e abbiamo sviluppato un’applicazione di esempio per questo. Di recente, abbiamo pubblicato un articolo sull’estrazione di immagini da PowerPoint utilizzando C#, dai un’occhiata alla guida come estrarre immagini da PowerPoint in C# per ulteriori informazioni. Se sei interessato a saperne di più sui prodotti GroupDocs, visita questo page.