Як витягти метадані з PDF за допомогою C#

У цьому навчальному посібнику ми описуємо покрокову процедуру вилучення метаданих із PDF за допомогою C# за допомогою .NET API для вилучення даних документа. Цей посібник також містить інструкції щодо налаштування необхідної бібліотеки та зразок коду для отримання метаданих із PDF на C#. Ось основні кроки та робочий код для вилучення метаданих із документів.

Кроки для вилучення метаданих із PDF за допомогою C#

  1. Налаштуйте пакет GroupDocs.Parser for .NET із менеджера пакетів NuGet у програмі .NET, щоб отримати метадані з PDF
  2. Додайте посилання на основні простори імен для вилучення метаданих із документа PDF
  3. Створіть екземпляр класу Parser і завантажте вхідний PDF-документ
  4. Викличте метод GetMetadata та отримайте колекцію об’єктів метаданих документа
  5. Нарешті, повторіть колекцію та отримайте імена та значення метаданих

Щоб реалізувати функцію читання метаданих PDF C#, просто виконайте наведені вище кроки по порядку. Перш за все, завантажте вихідний PDF, запустивши клас Parser після встановлення необхідного пакета з NuGet та імпорту основних просторів імен. Після цього метод GetMetadata дозволяє отримати об’єкти метаданих для документа, а потім виконати ітерацію по колекції для відображення імені та значень метаданих.

Код для вилучення метаданих із PDF за допомогою C#

Ми розробили програму C# для читання метаданих PDF, щоб продемонструвати роботу вилучення метаданих із функції документа. Ця програма створюється за допомогою кількох викликів API бібліотеки вилучення даних документів без встановлення додаткового програмного забезпечення. Крім того, цей приклад коду можна виконати в будь-якій операційній системі, як-от MS Windows, Linux і macOS, яка підтримує середовище .NET.

 Українська