U ovoj temi ćemo vas upoznati s time kako konvertirati HTML u Word pomoću Jave. Ovaj članak uključuje upute korak po korak za razvoj značajke, kao i primjer koda za generiranje DOCX iz HTML-a u Javi. U ovom vodiču koristit ćemo HTML datoteku kao ulaz i primijenit ćemo nekoliko redaka koda da je pretvorimo u Word dokument.
Koraci za pretvaranje HTML-a u Word pomoću Jave
- Instalirajte GroupDocs.Conversion for Java iz repozitorija Maven u projektu
- Učitajte ulaznu HTML datoteku stvaranjem instance Converter za izvođenje pretvorbe u Word format
- Inicijaliziraj klasu WordProcessingConvertOptions za definiranje parametara za konvertirani Word dokument
- Spremite izlazni dokument na disk korištenjem metode Convert i dostavite instancu WordProcessingConvertOptions zajedno s nazivom izlazne DOCX datoteke
Naveli smo nekoliko točaka koje su potrebne za implementaciju značajke pretvori HTML u Word Java. Da biste pretvorili dokument, morate dovršiti svaki korak ispravnim redoslijedom. Nadalje, ove upute ne zahtijevaju korištenje Microsoft Officea ili bilo kojeg drugog softvera treće strane. Ukratko, dodajte biblioteku svom Java projektu, stvorite objekte klasa Converter i WordProcessingConvertOptions, a zatim upotrijebite funkciju Convert za spremanje DOCX datoteke na disk.
Kod za pretvaranje HTML-a u Word pomoću Jave
import com.groupdocs.conversion.Converter; | |
import com.groupdocs.conversion.licensing.License; | |
import com.groupdocs.conversion.options.convert.WordProcessingConvertOptions; | |
public class ConvertHtmlToWordUsingJava { | |
public static void main(String[] args) { // Main function to convert HTML to Word in Java | |
// Remove the watermark in output Word document by adding license | |
License lic = new License(); | |
lic.setLicense("GroupDocs.Conversion.lic"); | |
// Load the source HTML file for conversion to DOCX | |
Converter converter = new Converter("sample.html"); | |
// Set the convert options for Word document | |
WordProcessingConvertOptions options = new WordProcessingConvertOptions(); | |
// Convert and save the HTML in DOCX format | |
converter.convert("converted.docx", options); | |
System.out.println("Done"); | |
} | |
} |
Ovaj primjer pokazuje kako se funkcija Java pretvara HTML u DOCX može koristiti za transformaciju dokumenata. U ovom vodiču pokrili smo osnovnu konverziju dokumenata i pretvorili HTML dokumente u DOCX format. Nadalje, također možete koristiti klasu WordProcessingConvertOptions za postavljanje različitih svojstava za naprednu konverziju u Word format. Štoviše, možete jednostavno pretvoriti bilo koji izvorni dokument u formate za obradu teksta kao što su DOC, DOCM, DOT, DOTM, DOTX, RTF i drugi.
U ovom smo članku naučili kako pretvoriti HTML dokument u Wordov dokument pomoću Jave. Međutim, pretvorbu JPG u PDF obradili smo u drugom članku; za više informacija pogledajte kako pretvoriti sliku u PDF u Javi.