このハウツー記事では、C# を使用して PDF から画像を抽出する完全なプロセス、画像を抽出するために必要なライブラリを構成する方法、および ** の実装を示すサンプル コードを提供します。 C# は PDF** アプリケーションから画像を抽出します。これらの手順は、追加のソフトウェアに依存せず、.NET 環境をサポートする MS Windows、Linux、および macOS などの任意のオペレーティング システムで使用できます。
C# を使用して PDF から画像を抽出する手順
- .NET プロジェクトの NuGet パッケージ マネージャーから GroupDocs.Parser for .NET パッケージをセットアップして、PDF ドキュメントから画像を抽出します
- PDF から画像を抽出するために必要な名前空間の参照を追加します
- 入力 PDF ドキュメントをロードするための Parser クラスのオブジェクトを作成します
- GetImages メソッドを呼び出して、画像オブジェクトのコレクションを取得します
- 最後に、コレクションを反復処理して、サイズ、画像の種類、および画像の内容を取得します。
.NET プロジェクトで extract image from PDF C# アプリケーションを開発する場合、上記の段階的な手順に簡単に従うことができます。 Parser クラスを使用すると、必要なパッケージを構成し、必須の名前空間をインポートした後に、ソース PDF ファイルを読み込んで画像を抽出できます。次に、Parser クラスの GetImages メソッドを使用して、画像オブジェクトのコレクションを取得し、それを解析して画像のサイズ、種類、および内容を抽出できます。
C# を使用して PDF から画像を抽出するコード
前のスニペットでは、PDF C# からイメージを取得 機能が、前のセクションで説明した手順を使用して開発されています。ご覧のとおり、PDF ファイルから画像を抽出するための API 呼び出しはほんの数回です。さらに、このサンプル コードは、DOC、DOCX、XLSX、XLT、HTML、PPT、PPTX、EPUB など、さまざまな他のドキュメント形式から画像を抽出するために適用できます。
この投稿では、C# で PDF から画像を抽出するための段階的なプロセスについて説明し、そのサンプル コードを開発しました。最近、C# を使用して PDF からテキストを抽出する記事を公開しました。詳細については、C# で PDF からテキストを抽出する方法 ガイドをご覧ください。