Come estrarre metadati da PDF usando C#

In questo tutorial, descriviamo la procedura dettagliata per estrarre i metadati da PDF utilizzando C# utilizzando l’API .NET per estrarre i dati del documento. Questa guida fornisce anche istruzioni su come configurare la libreria richiesta e un codice di esempio per ottenere metadati da PDF in C#. Ecco i passaggi chiave e il codice di lavoro per estrarre i metadati dai documenti.

Passaggi per estrarre metadati da PDF utilizzando C#

  1. Imposta il pacchetto GroupDocs.Parser for .NET dal gestore di pacchetti NuGet nell’applicazione .NET per estrarre i metadati dal PDF
  2. Aggiungi un riferimento agli spazi dei nomi essenziali per estrarre i metadati dal documento PDF
  3. Crea un’istanza della classe Parser e carica il documento PDF di input
  4. Chiama il metodo GetMetadata e ottieni una raccolta di oggetti di metadati del documento
  5. Infine, scorrere la raccolta e ottenere nomi e valori di metadati

Per implementare la funzionalità per leggere i metadati PDF C#, segui semplicemente i passaggi precedenti nell’ordine. Innanzitutto, carica il PDF di origine avviando la classe Parser dopo aver installato il pacchetto richiesto da NuGet e importato gli spazi dei nomi essenziali. Successivamente, il metodo GetMetadata consente di ottenere gli oggetti di metadati per il documento e quindi di scorrere la raccolta per visualizzare il nome e i valori dei metadati.

Codice per estrarre metadati da PDF utilizzando C#

using System;
using System.Collections.Generic;
using GroupDocs.Parser;
using GroupDocs.Parser.Data;
namespace ExtractMetadataFromPdfUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to extract metadata from PDF using C#
{
// Remove the watermark from output
string licensePath = "GroupDocs.Parser.lic";
GroupDocs.Parser.License lic = new GroupDocs.Parser.License();
lic.SetLicense(licensePath);
// Create an instance of Parser class
using (Parser parser = new Parser("sample.pdf"))
{
// Extract metadata from the document
IEnumerable<MetadataItem> metadata = parser.GetMetadata();
// Check if metadata extraction is supported
if (metadata == null)
{
Console.WriteLine("Metatada extraction isn't supported");
}
// Iterate over metadata items
foreach (MetadataItem item in metadata)
{
// Print an item name and value
Console.WriteLine(string.Format("{0}: {1}", item.Name, item.Value));
}
}
}
}
}

Abbiamo sviluppato l’applicazione C# read PDF metadata per dimostrare il funzionamento dell’estrazione dei metadati dalla funzione del documento. Questa applicazione viene creata consumando un paio di chiamate API della libreria di estrazione dei dati del documento senza configurare alcun software aggiuntivo. Inoltre, questo codice di esempio può essere eseguito su qualsiasi sistema operativo come MS Windows, Linux e macOS che supporta un ambiente .NET.

 Italiano