Cách chuyển đổi HTML thành văn bản bằng Java

Hướng dẫn nhanh này cung cấp hướng dẫn chi tiết để chuyển đổi HTML sang Text bằng cách sử dụng Java và mã mẫu để hiển thị việc triển khai khả năng Java HTML thành văn bản thuần túy. Hướng dẫn này sử dụng một trong những thư viện chuyển đổi tài liệu tốt nhất để thực hiện chuyển đổi tài liệu và nó có thể được cài đặt trên mọi hệ điều hành bao gồm MS Windows, Linux và Mac OS. Dưới đây là các bước và mã mẫu để lưu HTML dưới dạng Văn bản trong Java.

Các bước để chuyển đổi HTML thành văn bản bằng Java

  1. Thiết lập GroupDocs.Conversion for Java từ kho lưu trữ Maven để triển khai chức năng HTML thành Văn bản
  2. Nhập các lớp cần thiết để thực hiện chuyển đổi tài liệu từ HTML sang Văn bản
  3. Khởi tạo lớp Converter và chuyển tệp HTML nguồn tới hàm tạo của nó
  4. Khởi tạo lớp WordProcessingConvertOptions và xác định các tham số để tùy chỉnh tệp Văn bản đầu ra
  5. Cuối cùng, gọi phương thức Convert của lớp Converter và chuyển đường dẫn tệp TXT kết quả cùng với đối tượng WordProcessingConvertOptions

Để tạo chức năng chuyển đổi HTML thành Văn bản trong Java, hãy làm theo trình tự các điểm trên. Trước hết, hãy cài đặt thư viện cần thiết và nhập các lớp cần thiết. Sau đó, tải tài liệu HTML để chuyển đổi và xác định các tham số để tùy chỉnh tài liệu Văn bản đã chuyển đổi. Cuối cùng, phương thức Chuyển đổi cho phép lưu tệp kết quả vào đĩa.

Mã để chuyển đổi HTML thành văn bản bằng Java

Đoạn mã này được phát triển để chứng minh việc triển khai khả năng chuyển đổi HTML thành văn bản thuần túy Java. Chúng tôi đã sử dụng một số lệnh gọi API của thư viện trình chuyển đổi tài liệu để chuyển đổi tệp nguồn sang định dạng được yêu cầu. Hơn nữa, nó không yêu cầu bất kỳ phần mềm bên thứ ba nào khác thực hiện chuyển đổi tài liệu. Ngoài ra, đây là một quy trình rất dễ dàng để chuyển đổi các tài liệu khác nhau sang định dạng TXT, chẳng hạn như DOCX, CSV, DOT, DWG, EML, MD, v.v.

Chúng tôi đã thảo luận về các hướng dẫn chi tiết để thực hiện chuyển đổi tài liệu để thay đổi HTML thành Văn bản trong Java. Gần đây, chúng tôi đã xuất bản một bài viết về chuyển đổi PDF sang CSV bằng Java, hãy xem bài đăng cách chuyển đổi PDF sang CSV bằng Java để biết thêm thông tin.

 Tiếng Việt