Cách chuyển đổi PDF sang HTML bằng C#

Mục tiêu của bài đăng này là giải thích cho bạn cách chuyển đổi PDF sang HTML bằng C#. Làm theo hướng dẫn này, chuyển đổi tài liệu từ PDF sang HTML là một quy trình đơn giản. Bạn chỉ cần làm theo các bước dưới đây để chuyển đổi PDF sang HTML trong C# để thực hiện chuyển đổi tài liệu.

Các bước để chuyển đổi PDF sang HTML bằng C#

  1. Thiết lập plugin GroupDocs.Conversion for .NET từ NuGet
  2. Bao gồm không gian tên GroupDocs.Conversion
  3. Tạo một đối tượng của lớp Converter và tải tệp PDF nguồn
  4. Tạo một thể hiện của lớp MarkupConvertOptions
  5. Truyền các tham số như tên tệp đã chuyển đổi và phiên bản của lớp MarkupConvertOptions sang phương thức Chuyển đổi của lớp Trình chuyển đổi

Đây là các bước để đưa khả năng C# convert PDF to HTML vào hoạt động. Để bắt đầu, lớp Trình chuyển đổi được khởi tạo để tải tài liệu PDF nguồn. Sau đó, đối với tài liệu kết xuất, hãy tạo một phiên bản của lớp MarkupConvertOptions và đặt các thuộc tính khác nhau. Cuối cùng, gọi phương thức Convert và chỉ định một thể hiện của lớp MarkupConvertOptions, cũng như tên tệp của tài liệu đã chuyển đổi.

Mã để chuyển đổi PDF sang HTML bằng C#

Trong ví dụ trước, chúng tôi đã chỉ ra cách tạo tệp HTML từ tài liệu PDF bằng mã C# PDF sang HTML. Hơn nữa, chúng tôi đã xác định các thuộc tính cho tài liệu được chuyển đổi, chẳng hạn như danh sách các chỉ mục trang và số lượng trang. Tuy nhiên, bạn có thể đặt thêm các thuộc tính khác bao gồm số trang bắt đầu, mức thu phóng và nhiều thuộc tính khác của tài liệu kết xuất.

Trong bài viết trước của chúng tôi, chúng tôi đã kiểm tra tính năng chuyển đổi tài liệu Word sang HTML trong C#. Nếu bạn muốn tìm hiểu thêm, hãy xem hướng dẫn trên cách chuyển Tài liệu Word sang HTML bằng C#.

 Tiếng Việt