Cách trích xuất hình ảnh từ PDF bằng C#

Trong bài viết hướng dẫn này, chúng tôi cung cấp quy trình hoàn chỉnh để trích xuất hình ảnh từ PDF bằng C#, cách định cấu hình thư viện cần thiết để trích xuất hình ảnh và mã mẫu để chứng minh việc triển khai ** C# trích xuất hình ảnh từ ứng dụng PDF**. Các hướng dẫn này không phụ thuộc vào bất kỳ phần mềm bổ sung nào và có thể được sử dụng trên mọi hệ điều hành như MS Windows, Linux và macOS hỗ trợ môi trường .NET.

Các bước để trích xuất hình ảnh từ PDF bằng C#

  1. Thiết lập gói GroupDocs.Parser for .NET từ trình quản lý gói NuGet trong dự án .NET để trích xuất hình ảnh từ tài liệu PDF
  2. Thêm tham chiếu về các không gian tên cần thiết để trích xuất hình ảnh từ PDF
  3. Tạo một đối tượng của lớp Parser để tải tài liệu PDF đầu vào
  4. Gọi phương thức GetImages và nhận một tập hợp các đối tượng hình ảnh
  5. Cuối cùng, lặp lại bộ sưu tập và lấy kích thước, loại hình ảnh và nội dung hình ảnh

Có thể dễ dàng làm theo các hướng dẫn từng bước ở trên để phát triển ứng dụng trích xuất hình ảnh từ PDF C# trong các dự án .NET. Lớp Trình phân tích cú pháp cho phép tải tệp PDF nguồn để trích xuất hình ảnh sau khi định cấu hình gói được yêu cầu và nhập các không gian tên cần thiết. Sau đó, phương thức GetImages của lớp Trình phân tích cú pháp cho phép bạn lấy bộ sưu tập đối tượng hình ảnh và phân tích cú pháp nó để trích xuất kích thước, loại và nội dung hình ảnh.

Mã để trích xuất hình ảnh từ PDF bằng C#

Trong đoạn mã trước, khả năng lấy hình ảnh từ PDF C# được phát triển bằng cách sử dụng các hướng dẫn được giải thích trong phần trước. Như bạn có thể thấy, vấn đề chỉ là một vài lệnh gọi API để trích xuất hình ảnh từ tệp PDF. Ngoài ra, mã mẫu này có thể được điều chỉnh để trích xuất hình ảnh từ nhiều định dạng tài liệu khác bao gồm DOC, DOCX, XLSX, XLT, HTML, PPT, PPTX, EPUB, v.v.

Chúng tôi đã thảo luận về quy trình từng bước để trích xuất hình ảnh từ PDF trong C# và đã phát triển một mã mẫu cho nó trong bài đăng này. Gần đây, chúng tôi đã xuất bản một bài viết để trích xuất văn bản từ PDF bằng C#, hãy xem hướng dẫn cách trích xuất văn bản từ PDF trong C# để biết thêm thông tin.

 Tiếng Việt