Ez a rövid oktatóanyag lépésről lépésre ismerteti a metaadatok PDF-ből Java segítségével történő kinyerésének folyamatát. Az egyik legjobb metaadat-kivonó API-t fogjuk használni a metaadatok lekéréséhez a PDF dokumentumból. Továbbá megtudhatja, hogyan kell megírni a kódot a metaadatok beszerzéséhez Java nyelvű PDF-ből funkció létrehozásához. Az alábbiakban a metaadatok dokumentumokból való kinyerésére vonatkozó részletes utasításokat és mintakódot talál.
Lépések a metaadatok PDF-ből Java használatával történő kinyeréséhez
- Telepítse a(z) GroupDocs.Parser for Java fájlt a Java projekt Maven tárából a metaadatok kinyeréséhez a PDF dokumentumból
- Importáljon alapvető osztályokat a metaadatok PDF-dokumentumból történő kinyerésére szolgáló funkció fejlesztéséhez
- Hozzon létre egy példányt a Parser osztályból, és adja át a forrás PDF-fájlt a konstruktorának
- Hívja meg a getMetadata metódust, és szerezzen be egy PDF-dokumentum-metaadat-objektumot
- Végül ismételje meg a gyűjteményt, és jelenítse meg a metaadatneveket és értékeket
Felsoroltuk a lépésenkénti utasításokat a PDF metaadatok lekéréséhez Java használatával. Ezeket a pontokat sorrendben kell követnie a metaadatok PDF-dokumentumból való kinyeréséhez, és nem kell hozzá semmilyen további szoftvert beállítani. Ezek a lépések bármely operációs rendszeren használhatók, beleértve az MS Windowst, a Linuxot és a Mac OS-t is.
Kód a metaadatok kinyeréséhez a PDF-ből Java segítségével
A fenti példában kifejlesztettük a Java PDF metaadat képességet. Amint látja, az Parser osztályt a bemeneti PDF dokumentum betöltésére használják a metaadatok lekéréséhez. Ezt követően meghívtuk a getMetadata metódust a metaadatok összegyűjtésére és az iterációra a metaadatok nevének és értékének megjelenítésére. Metaadatokat is kivonhat különféle dokumentumformátumokból, például DOCX, XLSX, PPTX, MSG, EML, EPUB és még sok másból.
Megbeszéltük a metaadatok kinyerésének részletes eljárását a PDF-ből Java nyelven. Nemrég közzétettünk egy cikket a metaadatok kinyeréséről a Word dokumentumból Java nyelven. További információért tekintse meg a hogyan lehet metaadatokat kivonni a Word dokumentumból Java segítségével útmutatót.