Този бърз урок ще се съсредоточи върху процеса на извличане на изображения от документ Word с помощта на Java и предоставя примерен кодов фрагмент за демонстриране на работата и изпълнението на приложението Java за извличане на изображения от Word. Ще използваме една от най-добрите библиотеки за извличане на документи за извличане на изображения от документи и ще завършим тази функция с няколко прости извиквания на API. Освен това, това ръководство не разчита на инструмент на трета страна и може да се следва на всяка операционна система като Windows, macOS и Linux.
Стъпки за извличане на изображения от Word документ с помощта на Java
- Настройте GroupDocs.Parser for Java от хранилището на Maven в проекта Java, за да извлечете изображения от документа на Word
- Импортирайте основни класове за разработване на функционалността за извличане на изображения от Word файл
- Създайте екземпляр на класа Parser за зареждане на входния Word документ
- Извикайте метода getImages на класа Parser и вземете колекция от обекти на изображението
- И накрая, прегледайте колекцията от обекти на изображението, за да получите размера, типа и съдържанието на изображението
Предходните поетапни инструкции ви помагат бързо да приложите функцията извличане на всички изображения от документа на Word в Java. Класът Parser ви позволява да заредите входния файл на Word, след като настроите необходимата библиотека от хранилището на Maven и включите необходимия клас. След това можете да получите колекция от обекти на изображения, като извикате метода getImages на класа Parser и след това итерирате колекцията от изображения за показване на данните за изображението.
Код за извличане на изображения от Word документ с помощта на Java
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.data.PageImageArea; | |
public class ExtractImagesFromWordDocumentUsingJava { | |
public static void main(String[] args) { // Main function to extract images from Word documents in Java | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.docx")) { | |
// Extract images | |
Iterable < PageImageArea > images = parser.getImages(); | |
// Check if images extraction is supported | |
if (images == null) { | |
System.out.println("Images extraction isn't supported"); | |
return; | |
} | |
// Iterate over images | |
for (PageImageArea image: images) { | |
// Print a page index, rectangle and image type: | |
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), image.getRectangle(), image.getFileType())); | |
} | |
} | |
} | |
} |
Разработихме приложението, за да ви покажем как да получите изображения от Word файл с помощта на Java. Този примерен код е завършен чрез писане на няколко реда код и използване на няколко извиквания на API. Можете допълнително да подобрите този пример според вашите изисквания и да използвате този примерен код за извличане на изображения от други формати на документи като PDF, HTML, XLSX, PPTX, EPUB и много други.
Обсъдихме подробния процес за това как да получите изображение от документ на Word в Java и създадохме примерен код за него. Наскоро публикувахме статия за извличане на изображения от PDF с помощта на Java, вижте ръководството как да извличате изображения от PDF в Java за повече информация.