이 방법 도움말에서는 필수 라이브러리 구성에 대한 정보와 함께 자바의 PDF에서 이미지 추출에 대한 자세한 단계별 지침을 제공합니다. 이 튜토리얼은 구현을 보여주기 위해 Java를 사용하여 PDF에서 이미지를 추출하는 작업 예제도 제공합니다. 간단한 API 호출로 구성된 몇 줄의 코드로 PDF 문서에서 이미지 추출을 완료합니다.
Java의 PDF에서 이미지를 추출하는 단계
- PDF 문서에서 이미지를 추출하기 위해 Java 프로젝트의 Maven 저장소에서 GroupDocs.Parser for Java 설정
- PDF 문서에서 이미지 추출 기능 개발을 위한 필수 클래스 가져오기
- 입력 PDF 문서를 로드하기 위한 Parser 클래스 초기화
- Parser 클래스의 getImages 메소드를 호출하고 이미지 객체의 컬렉션을 얻습니다.
- 마지막으로 이미지의 크기, 유형 및 내용을 얻기 위해 이미지 개체 컬렉션을 반복합니다.
위의 사항을 따르면 PDF* 응용 프로그램에서 *Java 추출 이미지를 쉽게 만들 수 있습니다. 필요한 라이브러리를 설치하고 코드에서 필요한 클래스를 가져와서 이미지 추출 프로세스를 시작할 수 있습니다. 그런 다음 Parser 클래스를 사용하여 입력 PDF 파일을 로드할 수 있고 이 파일의 getImages 메서드를 사용하여 프로젝트에서 추가로 사용할 이미지 개체를 수집할 수 있습니다.
Java의 PDF에서 이미지를 추출하는 코드
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.data.PageImageArea; | |
public class ExtractImagesFromPdfInJava { | |
public static void main(String[] args) { // Main function to extract images form PDF in Java | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.pdf")) { | |
// Extract images | |
Iterable < PageImageArea > images = parser.getImages(); | |
// Check if images extraction is supported | |
if (images == null) { | |
System.out.println("Images extraction isn't supported"); | |
return; | |
} | |
// Iterate over images | |
for (PageImageArea image: images) { | |
// Print a page index, rectangle and image type: | |
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), image.getRectangle(), image.getFileType())); | |
} | |
} | |
} | |
} |
우리는 PDF Java 애플리케이션에서 이미지 추출을 개발하기 위해 몇 가지 API 호출을 사용했습니다. 또한 이 샘플 코드를 사용하여 DOC, DOCX, XLSX, PPTX 등을 포함한 다른 문서 형식에서 이미지를 추출할 수 있습니다. 또한 타사 소프트웨어를 설정하지 않고도 MS Windows, Linux 및 macOS와 같은 모든 운영 체제에서 이 예제를 실행할 수 있습니다.
Java에서 PDF에서 이미지를 가져오는 자세한 프로세스에 대해 논의하고 샘플 코드를 생성했습니다. 최근에 Java를 사용하여 PDF에서 텍스트를 추출하는 방법에 대한 기사를 게시했습니다. 자세한 내용은 Java에서 PDF에서 텍스트를 추출하는 방법 가이드를 참조하세요.