Ovaj kratki vodič usredotočit će se na proces ekstrahiranja slika iz Word dokumenta pomoću Jave i pruža primjer isječka koda za demonstraciju rada i implementacije Java ekstraktora slika iz Worda aplikacije. Koristit ćemo jednu od najboljih biblioteka za izdvajanje dokumenata za izdvajanje slika iz dokumenata i dovršiti ovu značajku s nekoliko jednostavnih API poziva. Štoviše, ovaj se vodič ne oslanja ni na jedan alat treće strane i može se pratiti na bilo kojem operativnom sustavu kao što su Windows, macOS i Linux.
Koraci za izdvajanje slika iz Word dokumenta pomoću Jave
- Postavite GroupDocs.Parser for Java iz repozitorija Maven u Java projektu za izdvajanje slika iz Word dokumenta
- Uvezite osnovne klase za razvoj funkcionalnosti za izdvajanje slika iz Word datoteke
- Napravite instancu klase Parser za učitavanje ulaznog Word dokumenta
- Pozovite metodu getImages klase Parser i dohvatite kolekciju slikovnih objekata
- Na kraju, iterirajte kroz kolekciju slikovnih objekata da biste dobili veličinu, vrstu i sadržaj slike
Prethodne postupne upute pomažu vam da brzo implementirate funkciju ekstrahiranja svih slika iz Word dokumenta u Javi. Klasa Parser omogućuje vam učitavanje ulazne Word datoteke nakon postavljanja potrebne biblioteke iz repozitorija Maven i uključivanja potrebne klase. Nakon toga možete dobiti kolekciju slikovnih objekata pozivanjem metode getImages klase Parser, a zatim iterirati preko kolekcije slika za prikaz slikovnih podataka.
Kod za izdvajanje slika iz Word dokumenta pomoću Jave
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.data.PageImageArea; | |
public class ExtractImagesFromWordDocumentUsingJava { | |
public static void main(String[] args) { // Main function to extract images from Word documents in Java | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.docx")) { | |
// Extract images | |
Iterable < PageImageArea > images = parser.getImages(); | |
// Check if images extraction is supported | |
if (images == null) { | |
System.out.println("Images extraction isn't supported"); | |
return; | |
} | |
// Iterate over images | |
for (PageImageArea image: images) { | |
// Print a page index, rectangle and image type: | |
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), image.getRectangle(), image.getFileType())); | |
} | |
} | |
} | |
} |
Razvili smo aplikaciju kako bismo vam pokazali kako dobiti slike iz Word datoteke pomoću Jave. Ovaj primjer koda dovršen je pisanjem nekoliko redaka koda i korištenjem nekoliko API poziva. Ovaj primjer možete dodatno poboljšati prema svojim zahtjevima, a također možete koristiti ovaj uzorak koda za izdvajanje slika iz drugih formata dokumenata kao što su PDF, HTML, XLSX, PPTX, EPUB i mnogi drugi.
Razgovarali smo o detaljnom postupku kako dobiti sliku iz Word dokumenta u Javi i izradili primjer koda za to. Nedavno smo objavili članak o izdvajanju slika iz PDF-a pomoću Jave, pogledajte kako izdvojiti slike iz PDF-a u Javi vodič za više informacija.