Cara Mengekstrak Teks dari Dokumen Word menggunakan C#

Artikel ini membahas semua informasi yang diperlukan untuk mengekstrak teks dari dokumen menggunakan salah satu .NET API terbaik untuk mengekstrak data dokumen dan memandu Anda tentang cara mengekstrak teks dari dokumen Word menggunakan C#. Selanjutnya, ini memberikan informasi untuk mengonfigurasi paket yang diperlukan dan contoh kerja untuk mendemonstrasikan penerapan C# ekstrak teks dari dokumen Word aplikasi. Berikut adalah langkah-langkah kunci serta kode contoh untuk mendapatkan teks dari dokumen Word.

Langkah-langkah untuk Mengekstrak Teks dari Dokumen Word menggunakan C#

  1. Instal paket GroupDocs.Parser for .NET dari situs NuGet di proyek .NET untuk mengekstrak teks dari dokumen Word
  2. Tambahkan referensi ruang nama yang diperlukan untuk mengekstraksi teks dari file Word
  3. Buat objek kelas Parser untuk memuat dokumen input DOCX
  4. Panggil metode GetText dari kelas Parser dan dapatkan objek TextReader
  5. Terakhir, gunakan metode ReadToEnd untuk membaca teks dari objek pembaca

Poin-poin di atas memungkinkan Anda dengan cepat membuat aplikasi untuk mengekstrak teks dari dokumen Word C#. Langkah-langkah ini tidak bergantung pada alat pihak ketiga mana pun untuk mengekstrak teks dari dokumen dan Anda dapat menggunakannya di platform apa pun seperti MS Windows, Linux, dan macOS yang mendukung lingkungan .NET. Selanjutnya, Anda harus menulis beberapa baris kode yang menggunakan beberapa panggilan API dari perpustakaan yang diperlukan untuk mendapatkan teks dari dokumen DOC atau DOCX.

Kode untuk Mengekstrak Teks dari Dokumen Word menggunakan C#

Kemampuan baca teks dari dokumen Word C# dikembangkan dalam cuplikan kode di atas untuk menunjukkan kepada Anda cara mengekstrak teks dari dokumen DOCX. Namun, Anda juga dapat menggunakan dokumen format DOC dalam kode contoh ini untuk mendapatkan teks. Selanjutnya, contoh ini dapat diadaptasi untuk mengekstrak teks dari berbagai format dokumen lain termasuk DOT, RTF, XLSX, CSV, MHTML, EML, PPTX, ZIP, PDF, dan banyak lagi.

Kami telah membahas proses untuk mengekstrak teks dari dokumen Word di C# dan mengembangkan kode sampel untuk itu di posting ini. Baru-baru ini, kami menerbitkan artikel untuk mengekstrak gambar dari PDF dalam C#, lihat panduan cara Mengekstrak Gambar dari PDF menggunakan C# untuk informasi lebih lanjut.

 Indonesian