В этом кратком руководстве показано, как преобразовать DOCX в HTML в Java. Преобразование документа может быть выполнено без использования MS Office или стороннего программного обеспечения. Мы объясним пошаговый процесс реализации возможности конвертировать DOCX в HTML Java и создадим пример кода для этого, используя эти инструкции.
Шаги для преобразования DOCX в HTML в Java
- Установите GroupDocs.Conversion for Java из репозитория Maven в приложение Java.
- Добавьте ссылку на необходимые классы для выполнения преобразования документа из DOCX в HTML.
- Создайте экземпляр класса Converter и передайте входной файл DOCX его конструктору.
- Создайте объект класса MarkupConvertOptions и задайте параметры преобразования для выходного HTML-документа.
- Наконец, сохраните выходной файл HTML на диск, вызвав метод Convert и передав ему имя выходного файла вместе с параметром MarkupConvertOptions.
Выполнение вышеперечисленных шагов по порядку позволит вам создать возможность Java конвертировать DOCX в HTML. Чтобы выполнить задачу, вам нужно всего лишь использовать несколько вызовов API и написать три-четыре строки кода. Вы можете начать работу над этой функцией, установив необходимую библиотеку, а затем импортировав в код нужные классы. На следующем шаге инициализируйте класс Converter и MarkupConvertOptions для загрузки входного файла DOCX и установите параметры преобразования для выходного HTML-файла. После этого вы можете использовать метод Convert класса Converter, чтобы сохранить полученный HTML-файл на диск.
Код для преобразования DOCX в HTML на Java
import com.groupdocs.conversion.Converter; | |
import com.groupdocs.conversion.licensing.License; | |
import com.groupdocs.conversion.options.convert.MarkupConvertOptions; | |
public class ConvertDocxToHtmlInJava { | |
public static void main(String[] args) { // Main function to convert DOCX to HTML in Java | |
// Remove the watermark in output HTML document by adding license | |
License lic = new License(); | |
lic.setLicense("GroupDocs.Conversion.lic"); | |
// Load the source DOCX file for conversion to HTML | |
Converter converter = new Converter("sample.docx"); | |
// Set the convert options for HTML format | |
MarkupConvertOptions options = new MarkupConvertOptions(); | |
// Convert and save the DOCX in HTML format | |
converter.convert("converted.html", options); | |
System.out.println("Done"); | |
} | |
} |
Предыдущий пример создан, чтобы показать вам, как реализовать функциональность DOCX to HTML Java. Этот пример кода демонстрирует базовое преобразование документа путем преобразования DOCX в HTML. Кроме того, установка различных свойств выходного HTML-файла с помощью вызовов MarkupConvertOptions упрощает настройку HTML-файла. Вы также можете конвертировать документы DOCX в различные другие форматы документов, включая MD, PPTX, XLSX, CSV, TIFF, MHTML, PNG и другие.
В этом разделе показано, как создать функциональность для конвертера Java DOCX в HTML. Недавно мы опубликовали статью о преобразовании из TIFF в PDF, см. как конвертировать TIFF в PDF на Java для получения дополнительной информации.