Kako pretvoriti Word dokument u HTML pomoću Jave

Ovaj članak objašnjava postupak korak po korak za konvertiranje Word dokumenta u HTML pomoću Jave. Ovaj će priručnik koristiti jednu od najboljih biblioteka za pretvaranje dokumenata za izvođenje transformacije dokumenata pomoću jednostavnih API poziva. Ovdje možete pogledati ključne točke i primjer isječka koda za aplikaciju Java pretvoriti Word u HTML.

Koraci za pretvaranje Word dokumenta u HTML pomoću Jave

  1. Postavite GroupDocs.Conversion for Java iz repozitorija Maven u Java aplikaciji za implementaciju mogućnosti Word dokumenta u HTML
  2. Uvezite osnovne klase za izvođenje pretvorbe dokumenata iz Word dokumenta u HTML
  3. Inicijalizirajte klasu Converter i učitajte izvornu Word datoteku za transformaciju u HTML format
  4. Stvorite objekt klase MarkupConvertOptions za postavljanje svojstava za prilagodbu pretvorene HTML datoteke
  5. Na kraju, pozovite metodu Convert klase Converter kako biste Word dokument spremili kao HTML datoteku na disk

Da biste implementirali funkciju Java Word u HTML, samo trebate slijediti gore navedene upute korak po korak u nizu. Ovi vam koraci pomažu da jednostavno izradite aplikaciju pisanjem nekoliko redaka koda i korištenjem nekoliko API poziva. Nadalje, ove upute ne ovise ni o jednom alatu treće strane i mogu se izvršiti na bilo kojem uobičajenom operativnom sustavu kao što su Linux, Windows i macOS.

Kod za pretvaranje Wordovog dokumenta u HTML pomoću Jave

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.licensing.License;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
public class ConvertWordDocumentToHtmlUsingJava {
public static void main(String[] args) { // Main function to convert Word document to HTML in Java
// Remove the watermark in output HTML document by adding license
License lic = new License();
lic.setLicense("GroupDocs.Conversion.lic");
// Load the source Word file for conversion to Text
Converter converter = new Converter("sample.doc");
// Set the convert options for HTML format
MarkupConvertOptions options = new MarkupConvertOptions();
// Convert and save the DOCX in HTML format
converter.convert("converted.html", options);
System.out.println("Done");
}
}

Razvili smo gornji isječak koda kako bismo vam pokazali implementaciju mogućnosti DOC u HTML Java. U primjeru koda možete vidjeti da se klasa Converter koristi za učitavanje ulazne Word datoteke nakon instaliranja potrebne biblioteke za pretvorbu dokumenata i uvoza osnovnih klasa koje su potrebne za transformaciju dokumenta. Nakon toga se pokreće MarkupConvertOptions za definiranje svojstava za prilagodbu pretvorene HTML datoteke, a zatim se poziva metoda Converter za izvođenje transformacije i spremanje rezultirajuće datoteke na disk.

Razgovarali smo o detaljnom postupku za razvoj funkcionalnosti za pretvorbu Java DOC u HTML. Nedavno smo objavili članak o pretvaranju Excela u sliku pomoću Jave, pogledajte kako pretvoriti Excel u sliku u Javi post za više informacija.

 Hrvatski