Ebben az útmutatóban részletes, lépésről lépésre szóló utasításokat adunk a képek Java nyelven történő kivonásához a PDF webhelyről, valamint a szükséges könyvtár konfigurálására vonatkozó információkat. Ez az oktatóanyag egy működő példát is tartalmaz a képek kinyerésére a PDF-ből Java segítségével a megvalósítás bemutatására. A PDF-dokumentumból néhány soros kóddal fejezzük be a képkivonást, amely egyszerű API-hívásokból áll.
Lépések a képek PDF-ből való kivonásához Java nyelven
- Állítsa be a(z) GroupDocs.Parser for Java alkalmazást a Java projekt Maven-tárából, hogy képeket bontsa ki a PDF-dokumentumból
- Importáljon alapvető osztályokat a képek PDF-dokumentumból történő kinyerésére szolgáló funkciók fejlesztéséhez
- Inicializálja a Parser osztályt a bemeneti PDF-dokumentum betöltéséhez
- Hívja meg az Parser osztály getImages metódusát, és szerezze be a képobjektumok gyűjteményét
- Végül ismételje meg a képobjektumok gyűjteményét a kép méretének, típusának és tartalmának megállapításához
A fenti pontok követésével könnyedén létrehozhatja a Java kivonat képeket PDF-ből alkalmazást. A képkinyerési folyamatot elindíthatja a szükséges könyvtár telepítésével és a szükséges osztályok kódba történő importálásával. Ezután a Parser osztály lehetővé teszi a bemeneti PDF fájl betöltését, a getImages metódus pedig lehetővé teszi a képobjektumok összegyűjtését a projektben való további felhasználáshoz.
Kód a képek PDF-ből való kivonásához Java nyelven
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.data.PageImageArea; | |
public class ExtractImagesFromPdfInJava { | |
public static void main(String[] args) { // Main function to extract images form PDF in Java | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.pdf")) { | |
// Extract images | |
Iterable < PageImageArea > images = parser.getImages(); | |
// Check if images extraction is supported | |
if (images == null) { | |
System.out.println("Images extraction isn't supported"); | |
return; | |
} | |
// Iterate over images | |
for (PageImageArea image: images) { | |
// Print a page index, rectangle and image type: | |
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), image.getRectangle(), image.getFileType())); | |
} | |
} | |
} | |
} |
Néhány API-hívást használtunk a extract images from PDF Java alkalmazások fejlesztéséhez. Ezt a mintakódot használhatja képek más dokumentumformátumokból való kinyerésére is, beleértve a DOC, DOCX, XLSX, PPTX és sok más formátumot. Ezenkívül ezt a példát bármilyen operációs rendszeren, például MS Windowson, Linuxon és macOS-en végrehajthatja anélkül, hogy harmadik féltől származó szoftvert kellene telepítenie.
Megbeszéltük a PDF-fájlok Java nyelven történő letöltésének részletes folyamatát, és elkészítettünk hozzá egy mintakódot. A közelmúltban közzétettünk egy cikket a PDF-ből Java segítségével történő szövegkivonatról. További információért tekintse meg a hogyan lehet szöveget kivonni a PDF-ből Java-ban útmutatót.