JavaでPDFから画像を抽出する方法

このハウツー記事では、Java で PDF から画像を抽出するための詳細な手順と、必要なライブラリを構成するための情報を提供します。このチュートリアルでは、Java を使用して PDF から画像を抽出する実際の例も提供し、実装を示します。簡単な API 呼び出しで構成される数行のコードを使用して、PDF ドキュメントからの画像抽出を完了します。

Java で PDF から画像を抽出する手順

  1. Java プロジェクトの Maven リポジトリから GroupDocs.Parser for Java をセットアップして、PDF ドキュメントから画像を抽出します。
  2. PDF ドキュメントから画像を抽出する機能を開発するために不可欠なクラスをインポートする
  3. 入力 PDF ドキュメントをロードするための Parser クラスを初期化します
  4. Parser クラスの getImages メソッドを呼び出して、画像オブジェクトのコレクションを取得する
  5. 最後に、画像オブジェクトのコレクションを反復処理して、画像のサイズ、タイプ、および内容を取得します。

上記のポイントに従うことで、Java で PDF から画像を抽出 アプリケーションを簡単に作成できます。必要なライブラリをインストールし、必要なクラスをコードにインポートすることで、画像抽出プロセスを開始できます。次に、Parser クラスを使用して入力 PDF ファイルをロードし、その getImages メソッドを使用してイメージ オブジェクトを収集し、プロジェクトでさらに使用できるようにします。

Java で PDF から画像を抽出するコード

import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.PageImageArea;
public class ExtractImagesFromPdfInJava {
public static void main(String[] args) { // Main function to extract images form PDF in Java
// Create an instance of Parser class
try (Parser parser = new Parser("sample.pdf")) {
// Extract images
Iterable < PageImageArea > images = parser.getImages();
// Check if images extraction is supported
if (images == null) {
System.out.println("Images extraction isn't supported");
return;
}
// Iterate over images
for (PageImageArea image: images) {
// Print a page index, rectangle and image type:
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), image.getRectangle(), image.getFileType()));
}
}
}
}

extract images from PDF Java アプリケーションを開発するために、いくつかの API 呼び出しを使用しました。このサンプル コードを使用して、DOC、DOCX、XLSX、PPTX などの他のドキュメント形式から画像を抽出することもできます。さらに、この例は、サードパーティ製ソフトウェアをセットアップすることなく、MS Windows、Linux、macOS などの任意のオペレーティング システムで実行できます。

Java で PDF から画像を取得する詳細なプロセスについて説明し、そのサンプル コードを作成しました。最近、Java を使用して PDF からテキストを抽出する記事を公開しました。詳細については、JavaでPDFからテキストを抽出する方法 ガイドをご覧ください。

 日本語