Kaip konvertuoti Word dokumentą į tekstą Java

Šiame straipsnyje mes sutelksime dėmesį į nuoseklią procedūrą, kaip konvertuoti Word dokumentą į Java tekstą. Galite pateikti ir DOC, arba DOCX dokumentus konvertuoti į TXT formatą. Be to, šiame vadove pateikiama informacija, kaip konfigūruoti aplinką konvertavimui atlikti, ir Java DOCX to TXT konverterio programos darbo kodo pavyzdys.

Veiksmai, kaip konvertuoti „Word“ dokumentą į tekstą „Java“.

  1. Įdiekite GroupDocs.Conversion for Java iš Maven saugyklos Java projekte, kad įdiegtumėte Word konvertavimo į TXT galimybę
  2. Importuokite pagrindines klases, skirtas dokumentų konvertavimui iš Word į teksto formatą
  3. Sukurkite Converter klasės objektą, kad įkeltumėte įvesties Word failą, skirtą transformuoti į tekstinį dokumentą
  4. Inicijuoti WordProcessingConvertOptions klasę, kad būtų galima apibrėžti parametrus, kad būtų galima tinkinti konvertuotą tekstinį failą
  5. Galiausiai iškvieskite konvertavimo metodą, kad išsaugotumėte Word kaip tekstinį failą diske

Aukščiau pateikti punktai yra aiškiai paaiškinti, kaip konvertuoti Word į tekstą naudojant Java. Įvesties Word failą galite pradėti įkelti inicijuodami konverterio klasę, įdiegę biblioteką iš Maven saugyklos ir importuodami esmines klases. Kitas veiksmas padeda apibrėžti konvertavimo parinktis, skirtas pritaikyti konvertuotą tekstinį failą naudojant WordProcessingConvertOption, o paskutinis veiksmas leidžia atlikti konvertavimą į nurodytą formatą ir išsaugoti gautą failą diske.

Kodas, skirtas konvertuoti Word dokumentą į tekstą Java

Mes sukūrėme programą Java Word to TXT konverteris, vykdydami laipsnišką procesą, paaiškintą ankstesniame skyriuje. Sunaudojome keletą paprastų dokumentų konvertavimo bibliotekos API iškvietimų ir parašėme kelias kodo eilutes dokumento transformavimui atlikti. Be to, mes pritaikėme konvertuotą failą, apibrėždami keletą ypatybių, naudodami objektą WordProcessingConvertOption. Be to, galite išplėsti šį pavyzdinį kodą pagal savo konkrečius poreikius ir vykdyti jį įprastose operacinėse sistemose, tokiose kaip Windows, MacOS ir Linux.

Mes aptarėme išsamią procedūrą, kaip konvertuoti Word dokumentą į tekstą naudojant Java ir sukūrėme pavyzdinį kodą. Neseniai paskelbėme straipsnį apie HTML konvertavimą į RTF naudojant Java. Daugiau informacijos rasite Kaip konvertuoti HTML į RTF Java įraše.

 Latviski