En este tema, lo familiarizaremos con cómo convertir HTML a Word usando Java. Este artículo incluye instrucciones paso a paso para desarrollar la función, así como código de muestra para generar DOCX a partir de HTML en Java. En este tutorial, utilizaremos un archivo HTML como entrada y aplicaremos algunas líneas de código para convertirlo en un documento de Word.
Pasos para convertir HTML a Word usando Java
- Instale GroupDocs.Conversion for Java desde el repositorio de Maven en el proyecto
- Cargue el archivo HTML de entrada creando una instancia de Converter para realizar la conversión al formato de Word
- Inicialice la clase WordProcessingConvertOptions para definir parámetros para el documento de Word convertido
- Guarde el documento de salida en un disco consumiendo el método Convert y proporcione la instancia de WordProcessingConvertOptions junto con el nombre del archivo DOCX de salida
Hemos enumerado algunos puntos necesarios para implementar la función convertir HTML a Word Java. Para convertir un documento, debe completar cada paso en el orden correcto. Además, estas instrucciones no exigen el uso de Microsoft Office o cualquier otro software de terceros. Para resumir, agregue la biblioteca a su proyecto Java, cree objetos de las clases Converter y WordProcessingConvertOptions, y luego use la función Convert para guardar el archivo DOCX en el disco.
Código para convertir HTML a Word usando Java
import com.groupdocs.conversion.Converter; | |
import com.groupdocs.conversion.licensing.License; | |
import com.groupdocs.conversion.options.convert.WordProcessingConvertOptions; | |
public class ConvertHtmlToWordUsingJava { | |
public static void main(String[] args) { // Main function to convert HTML to Word in Java | |
// Remove the watermark in output Word document by adding license | |
License lic = new License(); | |
lic.setLicense("GroupDocs.Conversion.lic"); | |
// Load the source HTML file for conversion to DOCX | |
Converter converter = new Converter("sample.html"); | |
// Set the convert options for Word document | |
WordProcessingConvertOptions options = new WordProcessingConvertOptions(); | |
// Convert and save the HTML in DOCX format | |
converter.convert("converted.docx", options); | |
System.out.println("Done"); | |
} | |
} |
Este ejemplo muestra cómo se puede utilizar la funcionalidad Java convert HTML to DOCX para transformar documentos. En esta guía, cubrimos la conversión básica de documentos y convertimos documentos HTML a formato DOCX. Además, también puede usar la clase WordProcessingConvertOptions para establecer diferentes propiedades para la conversión avanzada al formato de Word. Además, simplemente puede convertir cualquier documento de origen a formatos de procesamiento de textos como DOC, DOCM, DOT, DOTM, DOTX, RTF y otros.
En este artículo, aprendimos cómo convertir un documento HTML a un documento de Word usando Java. Sin embargo, cubrimos la conversión de JPG a PDF en otro artículo; para obtener más información, consulte cómo convertir una imagen a PDF en Java.