Как да извлечете изображения от Word документ с помощта на Java

Този бърз урок ще се съсредоточи върху процеса на извличане на изображения от документ Word с помощта на Java и предоставя примерен кодов фрагмент за демонстриране на работата и изпълнението на приложението Java за извличане на изображения от Word. Ще използваме една от най-добрите библиотеки за извличане на документи за извличане на изображения от документи и ще завършим тази функция с няколко прости извиквания на API. Освен това, това ръководство не разчита на инструмент на трета страна и може да се следва на всяка операционна система като Windows, macOS и Linux.

Стъпки за извличане на изображения от Word документ с помощта на Java

  1. Настройте GroupDocs.Parser for Java от хранилището на Maven в проекта Java, за да извлечете изображения от документа на Word
  2. Импортирайте основни класове за разработване на функционалността за извличане на изображения от Word файл
  3. Създайте екземпляр на класа Parser за зареждане на входния Word документ
  4. Извикайте метода getImages на класа Parser и вземете колекция от обекти на изображението
  5. И накрая, прегледайте колекцията от обекти на изображението, за да получите размера, типа и съдържанието на изображението

Предходните поетапни инструкции ви помагат бързо да приложите функцията извличане на всички изображения от документа на Word в Java. Класът Parser ви позволява да заредите входния файл на Word, след като настроите необходимата библиотека от хранилището на Maven и включите необходимия клас. След това можете да получите колекция от обекти на изображения, като извикате метода getImages на класа Parser и след това итерирате колекцията от изображения за показване на данните за изображението.

Код за извличане на изображения от Word документ с помощта на Java

import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.PageImageArea;
public class ExtractImagesFromWordDocumentUsingJava {
public static void main(String[] args) { // Main function to extract images from Word documents in Java
// Create an instance of Parser class
try (Parser parser = new Parser("sample.docx")) {
// Extract images
Iterable < PageImageArea > images = parser.getImages();
// Check if images extraction is supported
if (images == null) {
System.out.println("Images extraction isn't supported");
return;
}
// Iterate over images
for (PageImageArea image: images) {
// Print a page index, rectangle and image type:
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), image.getRectangle(), image.getFileType()));
}
}
}
}

Разработихме приложението, за да ви покажем как да получите изображения от Word файл с помощта на Java. Този примерен код е завършен чрез писане на няколко реда код и използване на няколко извиквания на API. Можете допълнително да подобрите този пример според вашите изисквания и да използвате този примерен код за извличане на изображения от други формати на документи като PDF, HTML, XLSX, PPTX, EPUB и много други.

Обсъдихме подробния процес за това как да получите изображение от документ на Word в Java и създадохме примерен код за него. Наскоро публикувахме статия за извличане на изображения от PDF с помощта на Java, вижте ръководството как да извличате изображения от PDF в Java за повече информация.

 Български