Baca Metadata dari PDF menggunakan C#

Metadata dalam file PDF berisi informasi penting tentang dokumen, seperti judul, penulis, tanggal pembuatan, tanggal modifikasi, kata kunci, dan lainnya. Mengekstraksi metadata ini bisa sangat bermanfaat untuk berbagai aplikasi, termasuk sistem manajemen dokumen, analisis data, dan tugas otomatisasi. Pada artikel ini, kita akan mempelajari cara membaca metadata dari PDF menggunakan C#. Berikut rincian proses dengan contoh kode untuk membantu Anda memahami cara membaca metadata PDF menggunakan C#.

Langkah-langkah Membaca Metadata dari PDF menggunakan C#

  1. Konfigurasikan IDE Anda untuk menggunakan GroupDocs.Metadata for .NET untuk mengekstrak metadata dari file PDF
  2. Buat objek Metadata menggunakan jalur file PDF sebagai parameter konstruktornya
  3. Tetapkan kriteria untuk memvalidasi informasi metadata yang dikumpulkan
  4. Tentukan kondisi untuk menggunakan metode Metadata.FindProperties
  5. Ulangi setiap properti satu per satu

Mengekstrak metadata dari file PDF menggunakan C# memberi pengembang wawasan berharga tentang properti dokumen seperti judul, penulis, tanggal pembuatan, tanggal modifikasi, dan kata kunci. Informasi ini sangat penting untuk sistem manajemen dokumen, analisis data, dan alur kerja otomatis. Anda dapat mengikuti petunjuk di atas pada Windows, macOS, atau Linux selama Anda telah menginstal .NET. Tidak perlu menginstal perangkat lunak tambahan untuk mengekstrak metadata PDF di C#. Setelah Anda menyiapkan pustaka yang direkomendasikan dan menyesuaikan jalur file, Anda dapat dengan mudah mengintegrasikan kode berikut ke dalam proyek Anda tanpa masalah atau komplikasi apa pun.

Kode untuk Membaca Metadata dari PDF menggunakan C#

using GroupDocs.Metadata;
using GroupDocs.Metadata.Common;
using GroupDocs.Metadata.Tagging;
using System.Text.RegularExpressions;
namespace ReadMetadataFromPDFUsingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Metadata library
License lic = new License();
lic.SetLicense(@"GroupDocs.Metadata.lic");
// Pass absolute or relative path of document to Metadata's constructor
using (Metadata metadata = new Metadata(@"input.pdf"))
{
if (metadata.FileFormat != FileFormat.Unknown && !metadata.GetDocumentInfo().IsEncrypted)
{
Console.WriteLine();
// Fetch all metadata properties that fall into a particular category
var properties = metadata.FindProperties(p => p.Tags.Any(t => t.Category == Tags.Content));
Console.WriteLine("The metadata properties describing some characteristics of the file content: title, keywords, language, etc.");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties having a specific type and value
var year = DateTime.Today.Year;
properties = metadata.FindProperties(p => p.Value.Type == MetadataPropertyType.DateTime &&
p.Value.ToStruct(DateTime.MinValue).Year == year);
Console.WriteLine("All datetime properties with the year value equal to the current year");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties whose names match the specified regex
const string pattern = "^author|company|(.+date.*)$";
Regex regex = new Regex(pattern, RegexOptions.IgnoreCase);
properties = metadata.FindProperties(p => regex.IsMatch(p.Name));
Console.WriteLine("All properties whose names match the following regex: {0}", pattern);
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
}
}
}
}
}

Kesimpulannya, artikel ini telah memberikan panduan komprehensif tentang cara mendapatkan metadata PDF dalam pemrograman C#. Dengan memanfaatkan perpustakaan Metadata, pengembang dapat secara efisien mengekstrak informasi penting seperti judul dokumen, penulis, tanggal pembuatan, tanggal modifikasi, dan kata kunci dari dokumen PDF. Memahami dan memanfaatkan teknik ekstraksi metadata di C# memberdayakan pengembang untuk membangun aplikasi yang kuat untuk manajemen dokumen, analisis data, dan tugas otomatisasi. Kami menyarankan Anda untuk bereksperimen dengan file PDF yang berbeda dan menjelajahi properti metadata tambahan yang dapat lebih meningkatkan kemampuan ekstraksi metadata dalam aplikasi C#.

Selama diskusi kami sebelumnya, kami memberikan tutorial mendalam tentang mengekstraksi metadata dari file PPTX menggunakan C#. Untuk pemahaman yang lebih menyeluruh tentang topik ini, sebaiknya lihat panduan lengkap kami tentang cara membaca metadata dari PPTX menggunakan C#.

 Indonesian