Cara Mengekstrak Teks dari PDF di C#

Tutorial singkat ini menjelaskan petunjuk mendetail untuk mengekstrak teks dari PDF di C#. Ini juga menyediakan aplikasi contoh untuk menunjukkan implementasi mengekstrak teks dari PDF menggunakan C#. Panduan ini menggunakan salah satu paket populer untuk mengekstrak data dokumen dari berbagai format dokumen. Di bawah ini adalah langkah-langkah inti dan kode contoh untuk mendapatkan teks dari PDF.

Langkah-langkah untuk Mengekstrak Teks dari PDF di C#

  1. Siapkan paket GroupDocs.Parser for .NET dari manajer paket NuGet di aplikasi .NET untuk mengekstrak teks dari PDF
  2. Tambahkan referensi ke ruang nama penting untuk mengekstrak teks dari dokumen PDF
  3. Buat instance kelas Parser untuk memuat dokumen PDF masukan
  4. Panggil metode GetText dan dapatkan objek pembaca teks
  5. Terakhir, baca teks dari pembaca dan tampilkan

Kami telah mencantumkan semua langkah kunci untuk mengembangkan C# ekstrak teks dari aplikasi PDF. Petunjuk untuk mengekstrak teks dari PDF ini dapat digunakan pada platform apa pun seperti MS Windows, Linux, dan macOS yang mendukung lingkungan .NET dan bahkan tanpa menginstal perangkat lunak pihak ketiga apa pun. Anda harus menulis beberapa baris kode yang terdiri dari panggilan API dari pustaka ekstraksi dokumen.

Kode untuk Mengekstrak Teks dari PDF di C#

Dalam cuplikan kode di atas, kami telah mengembangkan aplikasi C# membaca teks PDF untuk menunjukkan kepada Anda cara mendapatkan teks dari dokumen. Kami telah menggunakan file PDF untuk mengekstrak teks dalam contoh ini, namun Anda dapat mengekstrak teks dari berbagai dokumen lain seperti DOC, DOCX, XLS, XLSX, PPTX, MSG, XML, ZIP, dan banyak lagi.

Kami telah membahas proses secara rinci untuk mengimplementasikan fungsi C# get text from PDF dan membuat kode sampel untuk itu. Baru-baru ini, kami menerbitkan artikel untuk mengekstrak metadata dari PDF dalam C#, lihat panduan cara Mengekstrak Metadata dari PDF menggunakan C# untuk informasi lebih lanjut.

 Indonesian