この簡単なチュートリアルでは、Java を使用して Word ドキュメントから画像を抽出する プロセスに焦点を当て、Word からの Java 画像抽出 アプリケーションの動作と実装を示すサンプル コード スニペットを提供します。ドキュメントから画像を抽出するための最高のドキュメント抽出ライブラリの 1 つを使用し、いくつかの単純な API 呼び出しでこの機能を完成させます。さらに、このガイドはサードパーティのツールに依存しておらず、Windows、macOS、Linux などの任意のオペレーティング システムで実行できます。
Java を使用して Word 文書から画像を抽出する手順
- Java プロジェクトの Maven リポジトリから GroupDocs.Parser for Java をセットアップして、Word 文書から画像を抽出します
- Word ファイルから画像を抽出する機能を開発するために不可欠なクラスをインポートする
- 入力 Word ドキュメントをロードするための Parser クラスのインスタンスを作成します
- Parser クラスの getImages メソッドを呼び出して、画像オブジェクトのコレクションを取得します。
- 最後に、画像オブジェクトのコレクションを反復処理して、画像のサイズ、タイプ、および内容を取得します。
上記の段階的な手順は、Java で Word 文書からすべての画像を抽出 機能をすばやく実装するのに役立ちます。 Parser クラスを使用すると、Maven リポジトリから必要なライブラリをセットアップし、必要なクラスを含めた後で、入力 Word ファイルをロードできます。その後、Parser クラスの getImages メソッドを呼び出して画像オブジェクトのコレクションを取得し、画像データを表示するために画像コレクションを反復処理できます。
Java を使用して Word 文書から画像を抽出するコード
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.data.PageImageArea; | |
public class ExtractImagesFromWordDocumentUsingJava { | |
public static void main(String[] args) { // Main function to extract images from Word documents in Java | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.docx")) { | |
// Extract images | |
Iterable < PageImageArea > images = parser.getImages(); | |
// Check if images extraction is supported | |
if (images == null) { | |
System.out.println("Images extraction isn't supported"); | |
return; | |
} | |
// Iterate over images | |
for (PageImageArea image: images) { | |
// Print a page index, rectangle and image type: | |
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), image.getRectangle(), image.getFileType())); | |
} | |
} | |
} | |
} |
Java を使用して Word ファイルから画像を取得する方法 を示すアプリケーションを開発しました。このサンプル コードは、数行のコードを記述し、いくつかの API 呼び出しを使用することで完成します。要件に応じてこの例をさらに拡張し、このサンプル コードを使用して、PDF、HTML、XLSX、PPTX、EPUB などの他のドキュメント形式から画像を抽出することもできます。
Java で Word 文書から画像を取得する方法の詳細なプロセスについて説明し、そのサンプル コードを作成しました。最近、Java を使用して PDF から画像を抽出する記事を公開しました。詳細については、JavaでPDFから画像を抽出する方法 ガイドをご覧ください。