Cách chuyển đổi HTML thành văn bản trong C#

Trong hướng dẫn cách thực hiện này, chúng tôi giải thích quy trình từng bước để chuyển đổi HTML thành Text trong C#. Hướng dẫn này cung cấp thông tin toàn diện để thiết lập thư viện chuyển đổi tài liệu, hướng dẫn từng bước để thực hiện chuyển đổi tài liệu và mã mẫu cho khả năng C# chuyển đổi HTML sang văn bản thuần túy. Dưới đây là hướng dẫn chi tiết cùng với ví dụ hoạt động để chuyển đổi HTML thành Văn bản bằng C#.

Các bước để chuyển đổi HTML thành văn bản trong C#

  1. Cài đặt gói GroupDocs.Conversion for .NET từ NuGet trong dự án .NET để triển khai chức năng C# HTML thành văn bản thuần túy
  2. Thêm tham chiếu vào không gian tên GroupDocs.Conversion để chuyển đổi HTML thành Văn bản
  3. Khởi tạo lớp Converter và chuyển tệp HTML đầu vào tới hàm tạo của nó
  4. Khởi tạo lớp WordProcessingConvertOptions và xác định các tham số để tùy chỉnh tài liệu Văn bản
  5. Cuối cùng gọi phương thức Convert để lưu HTML dưới dạng Text

Các điểm trên cho phép bạn triển khai dễ dàng và nhanh chóng chức năng lấy văn bản thuần túy từ HTML C#. Bạn chỉ cần cài đặt gói cần thiết từ trang web NuGet, viết ba đến bốn dòng mã và sử dụng một vài lệnh gọi API để hoàn tất quá trình chuyển đổi tài liệu. Hơn nữa, các bước này không yêu cầu bất kỳ công cụ bổ sung nào của bên thứ ba và có thể được triển khai trên mọi hệ điều hành như MS Windows, Linux và Mac OS.

Mã để chuyển đổi HTML thành văn bản trong C#

Chúng tôi đã phát triển ví dụ trên bằng cách thực hiện theo các hướng dẫn được xác định trong phần trước để triển khai khả năng chuyển đổi HTML thành văn bản thuần C#. Như bạn có thể thấy, chúng tôi đã sử dụng lớp Trình chuyển đổi để tải tài liệu HTML đầu vào và đặt định dạng tệp đầu ra bằng cách sử dụng đối tượng WordProcessingConvertOptions. Cuối cùng, chúng tôi đã gọi phương thức Chuyển đổi để lưu tệp kết quả vào đĩa.

Chúng tôi đã tập trung vào quá trình chuyển đổi tài liệu để triển khai C# lấy văn bản thuần túy từ chức năng HTML. Gần đây, chúng tôi đã xuất bản một bài viết để thay đổi PDF thành CSV trong C#, hãy xem hướng dẫn cách chuyển đổi PDF sang CSV bằng C# để biết thêm thông tin.

 Tiếng Việt