Node.js'yi kullanarak PDF'yi TXT'ye dönüştürün

PDF dosyayla çalışıyorsanız ve içeriği düzenlenebilir bir biçimde çıkarmanız gerekiyorsa, Node.js’yi kullanarak kolayca PDF’yi TXT’ye dönüştürebilirsiniz. Bu dönüştürme işlemi genellikle biçimlendirme konusunda endişelenmeden belgelerden metin çıkarmak için gereklidir. Bu makalede, Node.js’de PDF’yi TXT’ye nasıl aktaracağınız sürecinde size yol göstereceğiz ve bunun için pratik bir yaklaşımı keşfedeceğiz. Bu dönüşüm özellikle büyük veri kümeleri, otomatik iş akışları veya metin tabanlı arama uygulamalarıyla uğraşırken kullanışlıdır. Çıkarılan içeriğin yapılandırılmasını sağlayarak işlenmesini, analiz edilmesini veya veritabanlarında saklanmasını kolaylaştırır.

Node.js kullanarak PDF’yi TXT’ye Dönüştürme Adımları

  1. PDF’den TXT’ye dönüştürmeyi etkinleştirmek için Java aracılığıyla Node.js için GroupDocs.Conversion uygulamasını kurup projenize entegre edin
  2. Groupdocs.conversion paketini uygulamanıza ekleyin
  3. Converter sınıfını örnekleyin ve PDF belgesini yüklemek için dosya yolunu sağlayın
  4. WordProcessingConvertOptions’ı yapılandırın ve hedef çıktı formatı olarak TXT’yi seçin
  5. PDF’yi işlemek ve bir TXT dosyası oluşturmak için Converter sınıfının dönüştürme yöntemini çağırın

Öncelikle gerekli kütüphaneyi kurmanız ve Node.js ortamınızı yapılandırmanız gerekir. Aşağıdaki kod, bir PDF dosyasının nasıl yükleneceğini ve bir metin dosyasına nasıl dönüştürüleceğini gösterir. WordProcessingConvertOptions formatı TXT olarak belirtmek için kullanılır. Dönüştürme ayarları yapılandırıldıktan sonra işlemi tamamlamak için Converter.convert yöntemini çağırabilirsiniz. Bu işlem Node.js’deki PDF’den TXT oluşturmanıza olanak tanır ve çıktıyı daha fazla işlem veya depolama için TXT dosyası olarak kaydedebilirsiniz.

Node.js kullanarak PDF’yi TXT’ye Dönüştürme Kodu

const conversion = require('@groupdocs/groupdocs.conversion')
const licensePath = "GroupDocs.Search.lic";
const license = new conversion.License()
license.setLicense(licensePath);
// Load the input PDF file
const converter = new conversion.Converter("sample.pdf");
const options = new conversion.WordProcessingConvertOptions();
options.setFormat(conversion.WordProcessingFileType.Txt);
// Save output TXT to disk
converter.convert("output.txt", options);
process.exit(0);

PDF’yi düz metne dönüştürmek, arama dizini oluşturma, veri çıkarma ve farklı uygulamalarda daha ileri işlemler yapma gibi görevler açısından değerlidir. Burada özetlenen yöntem, ekstra bağımlılığa ihtiyaç duymadan Node.js* kullanarak PDF’yi TXT’ye dönüştürmenin güvenilir bir yolunu sağlar. Yapılandırılmış bir yaklaşım izleyerek geliştiriciler metin dönüştürmeyi sorunsuz bir şekilde yöneterek hem doğruluk hem de verimlilik sağlayabilirler. Bu teknik özellikle metin tabanlı belge yönetimi, içerik analizi veya otomatik işlemeye odaklanan uygulamalar için avantajlıdır. İster küçük dosyalarla ister büyük PDF yığınlarıyla çalışıyor olun, bu yöntem, optimum verimliliği korurken kusursuz dönüştürmeyi garanti eder.

Daha önce Node.js kullanarak PDF’yi MHTML’ye dönüştürme konusunda ayrıntılı bir kılavuz yayınlamıştık. Ayrıntılı, adım adım talimatlar için Node.js’yi kullanarak PDF’yi MHTML’ye dönüştürün nasıl yapılacağına ilişkin eğitimimizin tamamına göz atmayı unutmayın.

 Türkçe