Метадані у файлах PDF містять важливу інформацію про документ, таку як назва, автор, дата створення, дата зміни, ключові слова тощо. Отримання цих метаданих може бути надзвичайно корисним для різних програм, включаючи системи керування документами, аналіз даних і завдання автоматизації. У цій статті ми розглянемо, як читати метадані з PDF за допомогою C#. Ось розбивка процесу з прикладом коду, який допоможе вам зрозуміти, як читати метадані PDF за допомогою C#.
Кроки для читання метаданих із PDF за допомогою C#
- Налаштуйте IDE на використання GroupDocs.Metadata for .NET для вилучення метаданих із файлів PDF
- Створіть об’єкт Metadata, використовуючи шлях до файлу PDF як параметр для його конструктора
- Встановіть критерії перевірки зібраної інформації метаданих
- Вкажіть умову використання методу Metadata.FindProperties
- Перегляньте кожну властивість одну за одною
Вилучення метаданих із файлів PDF за допомогою C# надає розробникам цінну інформацію про властивості документа, такі як назва, автор, дата створення, дата зміни та ключові слова. Ця інформація може бути важливою для систем керування документами, аналізу даних і автоматизованих робочих процесів. Ви можете виконувати наведені вище інструкції в Windows, macOS або Linux, якщо у вас встановлено .NET. Немає потреби встановлювати додаткове програмне забезпечення, щоб видобувати метадані PDF на C#. Після того, як ви налаштуєте рекомендовану бібліотеку та відповідно налаштуєте шляхи до файлів, ви зможете легко інтегрувати наведений нижче код у свої проекти без будь-яких проблем чи ускладнень.
Код для читання метаданих із PDF за допомогою C#
using GroupDocs.Metadata; | |
using GroupDocs.Metadata.Common; | |
using GroupDocs.Metadata.Tagging; | |
using System.Text.RegularExpressions; | |
namespace ReadMetadataFromPDFUsingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Set License to avoid the limitations of Metadata library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Metadata.lic"); | |
// Pass absolute or relative path of document to Metadata's constructor | |
using (Metadata metadata = new Metadata(@"input.pdf")) | |
{ | |
if (metadata.FileFormat != FileFormat.Unknown && !metadata.GetDocumentInfo().IsEncrypted) | |
{ | |
Console.WriteLine(); | |
// Fetch all metadata properties that fall into a particular category | |
var properties = metadata.FindProperties(p => p.Tags.Any(t => t.Category == Tags.Content)); | |
Console.WriteLine("The metadata properties describing some characteristics of the file content: title, keywords, language, etc."); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
// Fetch all properties having a specific type and value | |
var year = DateTime.Today.Year; | |
properties = metadata.FindProperties(p => p.Value.Type == MetadataPropertyType.DateTime && | |
p.Value.ToStruct(DateTime.MinValue).Year == year); | |
Console.WriteLine("All datetime properties with the year value equal to the current year"); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
// Fetch all properties whose names match the specified regex | |
const string pattern = "^author|company|(.+date.*)$"; | |
Regex regex = new Regex(pattern, RegexOptions.IgnoreCase); | |
properties = metadata.FindProperties(p => regex.IsMatch(p.Name)); | |
Console.WriteLine("All properties whose names match the following regex: {0}", pattern); | |
foreach (var property in properties) | |
{ | |
Console.WriteLine("{0} = {1}", property.Name, property.Value); | |
} | |
} | |
} | |
} | |
} | |
} |
На завершення ця стаття надає вичерпний посібник про те, як отримати метадані PDF у програмуванні C#. Використовуючи бібліотеку метаданих, розробники можуть ефективно отримувати важливу інформацію, таку як назва документа, автор, дата створення, дата зміни та ключові слова з документів PDF. Розуміння та використання методів вилучення метаданих у C# дає змогу розробникам створювати надійні програми для керування документами, аналізу даних і завдань автоматизації. Ми пропонуємо вам поекспериментувати з різними файлами PDF, а вивчення додаткових властивостей метаданих може ще більше розширити можливості вилучення метаданих у програмах C#.
Під час нашого попереднього обговорення ми надали поглиблений посібник із вилучення метаданих із файлів PPTX за допомогою C#. Щоб глибше зрозуміти цю тему, рекомендуємо звернутися до нашого обширного посібника про те, як читати метадані з PPTX за допомогою C#.