在这篇操作指南文章中,我们提供了详细的分步说明,以从 Java 中的 PDF 中提取图像 以及配置所需库的信息。本教程还提供了一个工作示例来**使用 Java **从 PDF 中提取图像来展示实现。我们将使用由简单 API 调用组成的几行代码完成 PDF 文档中的图像提取。
在 Java 中从 PDF 中提取图像的步骤
- 在 Java 项目的 Maven 存储库中设置 GroupDocs.Parser for Java 以从 PDF 文档中提取图像
- 导入基本类以开发从 PDF 文档中提取图像的功能
- 初始化 Parser 类以加载输入 PDF 文档
- 调用 Parser 类的 getImages 方法,获取图像对象的集合
- 最后,遍历图像对象的集合以获取图像的大小、类型和内容
按照以上几点,您可以轻松地创建 Java 从 PDF 提取图像应用程序。您可以通过安装所需的库并在代码中导入必要的类来开始图像提取过程。然后,Parser 类允许您加载输入的 PDF 文件,并且它的 getImages 方法使您能够收集图像对象以在项目中进一步使用。
用Java从PDF中提取图像的代码
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.data.PageImageArea; | |
public class ExtractImagesFromPdfInJava { | |
public static void main(String[] args) { // Main function to extract images form PDF in Java | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.pdf")) { | |
// Extract images | |
Iterable < PageImageArea > images = parser.getImages(); | |
// Check if images extraction is supported | |
if (images == null) { | |
System.out.println("Images extraction isn't supported"); | |
return; | |
} | |
// Iterate over images | |
for (PageImageArea image: images) { | |
// Print a page index, rectangle and image type: | |
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), image.getRectangle(), image.getFileType())); | |
} | |
} | |
} | |
} |
我们使用了一些 API 调用来开发从 PDF Java 中提取图像的应用程序。您还可以使用此示例代码从其他文档格式(包括 DOC、DOCX、XLSX、PPTX 等)中提取图像。此外,您可以在任何操作系统(例如 MS Windows、Linux 和 macOS)上执行此示例,而无需设置任何第三方软件。
我们已经讨论了在 Java 中从 PDF 获取图像的详细过程,并为它生成了一个示例代码。最近,我们发表了一篇关于使用 Java 从 PDF 中提取文本的文章,请查看 如何用Java从PDF中提取文本 指南了解更多信息。