ในบทความเชิงปฏิบัตินี้ เราจะมุ่งเน้นไปที่ขั้นตอนแบบทีละขั้นตอนเพื่อ แปลงเอกสาร Word เป็นข้อความใน Java คุณสามารถจัดเตรียมเอกสารทั้ง DOC หรือ DOCX เพื่อแปลงเป็นรูปแบบ TXT นอกจากนี้ คู่มือนี้ยังให้ข้อมูลสำหรับการกำหนดค่าสภาพแวดล้อมสำหรับการดำเนินการแปลงและรหัสการทำงานตัวอย่างสำหรับแอปพลิเคชัน ตัวแปลง Java DOCX เป็น TXT
ขั้นตอนในการแปลงเอกสาร Word เป็นข้อความใน Java
- ติดตั้ง GroupDocs.Conversion for Java จากที่เก็บ Maven ในโครงการ Java เพื่อใช้ความสามารถในการแปลง Word เป็น TXT
- นำเข้าคลาสที่จำเป็นสำหรับการแปลงเอกสารจากรูปแบบ Word เป็น Text
- สร้างวัตถุของคลาส Converter สำหรับการโหลดไฟล์ Word อินพุตเพื่อแปลงเป็นเอกสารข้อความ
- เริ่มต้นคลาส WordProcessingConvertOptions เพื่อกำหนดพารามิเตอร์เพื่อปรับแต่งไฟล์ Text ที่แปลงแล้ว
- สุดท้าย เรียกใช้เมธอด Convert เพื่อบันทึก Word เป็นไฟล์ข้อความบนดิสก์
ประเด็นข้างต้นอธิบายอย่างชัดเจนถึงวิธี แปลง Word เป็น Text โดยใช้ Java คุณสามารถเริ่มโหลดไฟล์ Word อินพุตได้โดยเริ่มต้นคลาส Converter หลังจากติดตั้งไลบรารีจากที่เก็บ Maven และนำเข้าคลาสที่จำเป็น ขั้นตอนต่อไปจะช่วยให้คุณสามารถกำหนดตัวเลือกการแปลงสำหรับการปรับแต่งไฟล์ข้อความที่แปลงแล้วโดยใช้ WordProcessingConvertOption และขั้นตอนสุดท้ายจะช่วยให้คุณสามารถแปลงเป็นรูปแบบที่ระบุและบันทึกไฟล์ผลลัพธ์ลงในดิสก์
รหัสเพื่อแปลงเอกสาร Word เป็นข้อความใน Java
เราได้พัฒนาแอปพลิเคชัน ตัวแปลง Java Word เป็น TXT โดยทำตามขั้นตอนแบบขั้นตอนที่อธิบายไว้ในส่วนก่อนหน้า เราใช้การเรียก API ง่ายๆ ของไลบรารีการแปลงเอกสารและเขียนโค้ดสองสามบรรทัดสำหรับดำเนินการแปลงเอกสาร นอกจากนี้ เราได้ปรับแต่งไฟล์ที่แปลงแล้วโดยการกำหนดคุณสมบัติสองสามอย่างโดยใช้วัตถุ WordProcessingConvertOption นอกจากนี้ คุณสามารถขยายโค้ดตัวอย่างนี้ตามความต้องการเฉพาะของคุณ และยังสามารถดำเนินการบนระบบปฏิบัติการทั่วไป เช่น Windows, macOS และ Linux
เราได้กล่าวถึงขั้นตอนโดยละเอียดเกี่ยวกับวิธีแปลงเอกสาร Word เป็นข้อความโดยใช้ Java และสร้างโค้ดตัวอย่างสำหรับเอกสารนั้น เมื่อเร็วๆ นี้ เราได้เผยแพร่บทความเกี่ยวกับการแปลง HTML เป็น RTF โดยใช้ Java ดูข้อมูลเพิ่มเติมที่โพสต์ วิธีแปลง HTML เป็น RTF ใน Java