Šioje trumpoje pamokoje aprašomas žingsnis po žingsnio metaduomenų ištraukimo iš PDF naudojant Java procesas. Naudosime vieną geriausių metaduomenų ištraukimo API metaduomenims iš PDF dokumento gauti. Be to, išmoksite parašyti kodą, kad sukurtumėte metaduomenų gavimą iš PDF Java funkcionalumą. Toliau pateikiamos išsamios instrukcijos ir pavyzdinis kodas, kaip išgauti metaduomenis iš dokumentų.
Veiksmai metaduomenų ištraukimui iš PDF naudojant Java
- Įdiekite GroupDocs.Parser for Java iš Maven saugyklos Java projekte, kad ištrauktumėte metaduomenis iš PDF dokumento
- Importuokite pagrindines klases, skirtas kurti metaduomenų ištraukimo iš PDF dokumento funkcionalumą
- Sukurkite klasės Parser egzempliorių ir perduokite šaltinio PDF failą jo konstruktoriui
- Iškvieskite metodą getMetadata ir gaukite PDF dokumento metaduomenų objektų rinkinį
- Galiausiai peržiūrėkite rinkinį ir parodykite metaduomenų pavadinimus ir reikšmes
Pateikėme nuoseklias instrukcijas, kaip gauti PDF metaduomenis naudojant Java*. Norėdami išgauti metaduomenis iš PDF dokumento, turite laikytis šių punktų ir jums nereikia nustatyti jokios papildomos programinės įrangos. Šiuos veiksmus galima atlikti bet kurioje operacinėje sistemoje, įskaitant MS Windows, Linux ir Mac OS.
Kodas metaduomenų ištraukimui iš PDF naudojant Java
Aukščiau pateiktame pavyzdyje sukūrėme Java PDF metaduomenų galimybę. Kaip matote, Parser klasė naudojama įvesties PDF dokumentui metaduomenims gauti. Po to mes iškvietėme metodą getMetadata metaduomenims rinkti ir kartoti, kad būtų rodomas metaduomenų pavadinimas ir reikšmė. Taip pat galite išgauti metaduomenis iš įvairių dokumentų formatų, tokių kaip DOCX, XLSX, PPTX, MSG, EML, EPUB ir daugelio kitų.
Aptarėme išsamią metaduomenų ištraukimo iš PDF Java procedūrą. Neseniai paskelbėme straipsnį apie metaduomenų ištraukimą iš Word dokumento Java. Daugiau informacijos rasite kaip išgauti metaduomenis iš Word dokumento naudojant Java vadove.