Как извлечь метаданные из PDF с помощью C#

В этом практическом руководстве мы описываем пошаговую процедуру извлечения метаданных из PDF с помощью C#, используя .NET API для извлечения данных документа. В этом руководстве также содержатся инструкции по настройке необходимой библиотеки и пример кода для получения метаданных из PDF на C#. Вот ключевые шаги и рабочий код для извлечения метаданных из документов.

Шаги по извлечению метаданных из PDF с помощью C#

  1. Настройте пакет GroupDocs.Parser for .NET из диспетчера пакетов NuGet в приложении .NET для извлечения метаданных из PDF.
  2. Добавьте ссылку на основные пространства имен для извлечения метаданных из документа PDF.
  3. Создайте экземпляр класса Parser и загрузите входной PDF-документ.
  4. Вызовите метод GetMetadata и получите коллекцию объектов метаданных документа.
  5. Наконец, выполните итерацию по коллекции и получите имена и значения метаданных.

Чтобы реализовать функцию чтения метаданных PDF C#, просто выполните описанные выше шаги по порядку. Прежде всего, загрузите исходный PDF-файл, запустив класс Parser после установки необходимого пакета из NuGet и импорта основных пространств имен. После этого метод GetMetadata позволяет получить объекты метаданных для документа, а затем выполнить итерацию по коллекции для отображения имени и значений метаданных.

Код для извлечения метаданных из PDF с использованием С#

Мы разработали приложение C# для чтения метаданных PDF, чтобы продемонстрировать работу по извлечению метаданных из функции документа. Это приложение создается путем использования нескольких вызовов API библиотеки извлечения данных документа без установки какого-либо дополнительного программного обеспечения. Кроме того, этот пример кода можно выполнить в любой операционной системе, такой как MS Windows, Linux и macOS, которые поддерживают среду .NET.

 Русский