У цьому короткому посібнику буде зосереджено увагу на процесі видобування зображень із документа Word за допомогою Java і надано зразок фрагмента коду, щоб продемонструвати роботу та реалізацію програми вилучення зображень Java із Word. Ми використаємо одну з найкращих бібліотек вилучення документів для видобування зображень із документів і доповнимо цю функцію кількома простими викликами API. Крім того, цей посібник не покладається на сторонні інструменти, і його можна використовувати в будь-якій операційній системі, як-от Windows, macOS і Linux.
Кроки для вилучення зображень із документа Word за допомогою Java
- Налаштуйте GroupDocs.Parser for Java зі сховища Maven у проекті Java, щоб отримати зображення з документа Word
- Імпорт основних класів для розробки функціональності для видобування зображень із файлу Word
- Створіть екземпляр класу Parser для завантаження вхідного документа Word
- Викличте метод getImages класу Parser і отримайте колекцію об’єктів зображення
- Нарешті, перегляньте колекцію об’єктів зображення, щоб отримати розмір, тип і вміст зображення
Попередні поетапні інструкції допоможуть вам швидко реалізувати функцію вилучення всіх зображень із документа Word у Java. Клас Parser дозволяє завантажувати вхідний файл Word після налаштування необхідної бібліотеки зі сховища Maven і включення необхідного класу. Після цього ви можете отримати колекцію об’єктів зображення, викликавши метод getImages класу Parser, а потім виконати ітерацію по колекції зображень для відображення даних зображення.
Код для вилучення зображень із документа Word за допомогою Java
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.data.PageImageArea; | |
public class ExtractImagesFromWordDocumentUsingJava { | |
public static void main(String[] args) { // Main function to extract images from Word documents in Java | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.docx")) { | |
// Extract images | |
Iterable < PageImageArea > images = parser.getImages(); | |
// Check if images extraction is supported | |
if (images == null) { | |
System.out.println("Images extraction isn't supported"); | |
return; | |
} | |
// Iterate over images | |
for (PageImageArea image: images) { | |
// Print a page index, rectangle and image type: | |
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), image.getRectangle(), image.getFileType())); | |
} | |
} | |
} | |
} |
Ми розробили програму, щоб показати вам як отримати зображення з файлу Word за допомогою Java. Цей приклад коду завершується написанням кількох рядків коду та використанням кількох викликів API. Ви можете вдосконалити цей приклад відповідно до ваших вимог, а також можете використовувати цей зразок коду для вилучення зображень з інших форматів документів, таких як PDF, HTML, XLSX, PPTX, EPUB тощо.
Ми обговорили детальний процес того, як отримати зображення з документа Word на Java, і підготували зразок коду для цього. Нещодавно ми опублікували статтю про видобування зображень із PDF за допомогою Java. Перегляньте посібник як витягти зображення з PDF на Java для отримання додаткової інформації.