U ovom članku s uputama usredotočit ćemo se na postupak korak po korak za konvertiranje Word dokumenta u tekst u Javi. Možete dati dokumente DOC ili DOCX za pretvaranje u TXT format. Nadalje, ovaj vodič pruža informacije za konfiguriranje okruženja za izvođenje konverzije i primjer radnog koda za aplikaciju Java DOCX u TXT pretvarač.
Koraci za pretvaranje Word dokumenta u tekst u Javi
- Instalirajte GroupDocs.Conversion for Java iz repozitorija Maven u Java projektu za implementaciju mogućnosti pretvaranja Worda u TXT
- Uvezite osnovne klase za izvođenje pretvorbe dokumenta iz Worda u tekstualni format
- Napravite objekt klase Converter za učitavanje ulazne Word datoteke za pretvaranje u tekstualni dokument
- Inicijalizirajte klasu WordProcessingConvertOptions za definiranje parametara za prilagodbu pretvorene tekstualne datoteke
- Na kraju, pozovite metodu Convert da biste Word spremili kao tekstualnu datoteku na disk
Gore navedene točke jasno objašnjavaju kako pretvoriti Word u tekst pomoću Jave. Možete započeti učitavanje ulazne Word datoteke inicijaliziranjem klase Converter nakon instaliranja biblioteke iz repozitorija Maven i uvoza osnovnih klasa. Sljedeći korak vam pomaže da definirate opcije pretvorbe za prilagodbu pretvorene tekstualne datoteke pomoću opcije WordProcessingConvertOption, a posljednji korak vam omogućuje pretvorbu u navedeni format i spremanje rezultirajuće datoteke na disk.
Kod za pretvaranje Word dokumenta u tekst u Javi
import com.groupdocs.conversion.Converter; | |
import com.groupdocs.conversion.licensing.License; | |
import com.groupdocs.conversion.options.convert.WordProcessingConvertOptions; | |
import com.groupdocs.conversion.filetypes.WordProcessingFileType; | |
public class ConvertWordDocumentToTextInJava { | |
public static void main(String[] args) { // Main function to convert Word to Text in Java | |
// Remove the watermark in output Text document by adding license | |
License lic = new License(); | |
lic.setLicense("GroupDocs.Conversion.lic"); | |
// Load the source Word file for conversion to Text | |
Converter converter = new Converter("sample.docx"); | |
// Set the convert options for TXT format | |
WordProcessingConvertOptions options = new WordProcessingConvertOptions(); | |
options.setPageNumber(1); | |
options.setPagesCount(1); | |
options.setFormat(WordProcessingFileType.Txt); // Specify the conversion format | |
// Convert and save the DOCX in TXT format | |
converter.convert("converted.txt", options); | |
System.out.println("Done"); | |
} | |
} |
Razvili smo aplikaciju Java Word to TXT converter slijedeći postupni postupak objašnjen u prethodnom odjeljku. Iskoristili smo nekoliko jednostavnih API poziva biblioteke za konverziju dokumenata i napisali nekoliko redaka koda za izvođenje transformacije dokumenta. Nadalje, prilagodili smo pretvorenu datoteku definiranjem nekoliko svojstava pomoću objekta WordProcessingConvertOption. Štoviše, ovaj primjer koda možete proširiti prema svojim specifičnim potrebama i također ga možete izvršiti na uobičajenim operativnim sustavima kao što su Windows, macOS i Linux.
Raspravljali smo o detaljnoj proceduri pretvaranja Word dokumenta u tekst pomoću Jave i izradili primjer koda za to. Nedavno smo objavili članak o pretvaranju HTML-a u RTF pomoću Jave, pogledajte kako pretvoriti HTML u RTF u Javi post za više informacija.