Jak wyodrębnić obrazy z pliku PDF w Javie

W tym artykule znajdziesz szczegółowe instrukcje krok po kroku dotyczące wyodrębniania obrazów z PDF w Javie wraz z informacjami dotyczącymi konfigurowania wymaganej biblioteki. Ten samouczek zawiera również działający przykład wyodrębniania obrazów z pliku PDF przy użyciu języka Java w celu pokazania implementacji. Uzupełnimy ekstrakcję obrazu z dokumentu PDF kilkoma liniami kodu, które składają się z prostych wywołań API.

Kroki, aby wyodrębnić obrazy z pliku PDF w Javie

  1. Skonfiguruj GroupDocs.Parser for Java z repozytorium Maven w projekcie Java, aby wyodrębnić obrazy z dokumentu PDF
  2. Importuj podstawowe klasy do rozwijania funkcjonalności wyodrębniania obrazów z dokumentu PDF
  3. Zainicjuj klasę Parser do ładowania wejściowego dokumentu PDF
  4. Wywołaj metodę getImages klasy Parser i uzyskaj kolekcję obiektów image
  5. Na koniec wykonaj iterację w kolekcji obiektów obrazu, aby uzyskać rozmiar, typ i zawartość obrazu

Postępując zgodnie z powyższymi punktami, możesz łatwo utworzyć obrazy wyodrębniające pliki Java z aplikacji PDF*. Możesz rozpocząć proces ekstrakcji obrazu, instalując wymaganą bibliotekę i importując niezbędne klasy w kodzie. Następnie klasa Parser umożliwia załadowanie wejściowego pliku PDF, a metoda getImages umożliwia zebranie obiektów obrazu do dalszego wykorzystania w projekcie.

Kod do wyodrębniania obrazów z plików PDF w Javie

import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.PageImageArea;
public class ExtractImagesFromPdfInJava {
public static void main(String[] args) { // Main function to extract images form PDF in Java
// Create an instance of Parser class
try (Parser parser = new Parser("sample.pdf")) {
// Extract images
Iterable < PageImageArea > images = parser.getImages();
// Check if images extraction is supported
if (images == null) {
System.out.println("Images extraction isn't supported");
return;
}
// Iterate over images
for (PageImageArea image: images) {
// Print a page index, rectangle and image type:
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), image.getRectangle(), image.getFileType()));
}
}
}
}

Użyliśmy kilku wywołań API, aby opracować aplikację wyodrębniania obrazów z PDF Java. Możesz także użyć tego przykładowego kodu do wyodrębniania obrazów z innych formatów dokumentów, w tym DOC, DOCX, XLSX, PPTX i wielu innych. Co więcej, możesz uruchomić ten przykład na dowolnym systemie operacyjnym, takim jak MS Windows, Linux i macOS, bez konfigurowania oprogramowania innych firm.

Omówiliśmy szczegółowy proces pobierania obrazów z plików PDF w Javie i stworzyliśmy przykładowy kod. Niedawno opublikowaliśmy artykuł na temat wyodrębniania tekstu z plików PDF przy użyciu języka Java. Więcej informacji można znaleźć w przewodniku jak wyodrębnić tekst z pliku PDF w Javie.

 Polski