Hogyan lehet képeket kivonni a PDF-ből Java-ban

Ebben az útmutatóban részletes, lépésről lépésre szóló utasításokat adunk a képek Java nyelven történő kivonásához a PDF webhelyről, valamint a szükséges könyvtár konfigurálására vonatkozó információkat. Ez az oktatóanyag egy működő példát is tartalmaz a képek kinyerésére a PDF-ből Java segítségével a megvalósítás bemutatására. A PDF-dokumentumból néhány soros kóddal fejezzük be a képkivonást, amely egyszerű API-hívásokból áll.

Lépések a képek PDF-ből való kivonásához Java nyelven

  1. Állítsa be a(z) GroupDocs.Parser for Java alkalmazást a Java projekt Maven-tárából, hogy képeket bontsa ki a PDF-dokumentumból
  2. Importáljon alapvető osztályokat a képek PDF-dokumentumból történő kinyerésére szolgáló funkciók fejlesztéséhez
  3. Inicializálja a Parser osztályt a bemeneti PDF-dokumentum betöltéséhez
  4. Hívja meg az Parser osztály getImages metódusát, és szerezze be a képobjektumok gyűjteményét
  5. Végül ismételje meg a képobjektumok gyűjteményét a kép méretének, típusának és tartalmának megállapításához

A fenti pontok követésével könnyedén létrehozhatja a Java kivonat képeket PDF-ből alkalmazást. A képkinyerési folyamatot elindíthatja a szükséges könyvtár telepítésével és a szükséges osztályok kódba történő importálásával. Ezután a Parser osztály lehetővé teszi a bemeneti PDF fájl betöltését, a getImages metódus pedig lehetővé teszi a képobjektumok összegyűjtését a projektben való további felhasználáshoz.

Kód a képek PDF-ből való kivonásához Java nyelven

import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.PageImageArea;
public class ExtractImagesFromPdfInJava {
public static void main(String[] args) { // Main function to extract images form PDF in Java
// Create an instance of Parser class
try (Parser parser = new Parser("sample.pdf")) {
// Extract images
Iterable < PageImageArea > images = parser.getImages();
// Check if images extraction is supported
if (images == null) {
System.out.println("Images extraction isn't supported");
return;
}
// Iterate over images
for (PageImageArea image: images) {
// Print a page index, rectangle and image type:
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), image.getRectangle(), image.getFileType()));
}
}
}
}

Néhány API-hívást használtunk a extract images from PDF Java alkalmazások fejlesztéséhez. Ezt a mintakódot használhatja képek más dokumentumformátumokból való kinyerésére is, beleértve a DOC, DOCX, XLSX, PPTX és sok más formátumot. Ezenkívül ezt a példát bármilyen operációs rendszeren, például MS Windowson, Linuxon és macOS-en végrehajthatja anélkül, hogy harmadik féltől származó szoftvert kellene telepítenie.

Megbeszéltük a PDF-fájlok Java nyelven történő letöltésének részletes folyamatát, és elkészítettünk hozzá egy mintakódot. A közelmúltban közzétettünk egy cikket a PDF-ből Java segítségével történő szövegkivonatról. További információért tekintse meg a hogyan lehet szöveget kivonni a PDF-ből Java-ban útmutatót.

 Magyar