Comment convertir un PDF en texte en utilisant Java

Ce didacticiel rapide décrit la procédure étape par étape pour convertir PDF en Text à l’aide de Java. Il fournit des informations complètes sur l’installation de la bibliothèque de conversion de documents, des instructions pas à pas pour effectuer la transformation de documents et un exemple d’extrait de code pour démontrer l’implémentation pour convertir PDF en texte en Java. Voici les instructions détaillées ainsi qu’un exemple fonctionnel pour exporter un PDF en tant que texte.

Étapes pour convertir un PDF en texte à l’aide de Java

  1. Installez GroupDocs.Conversion for Java à partir du référentiel Maven pour implémenter la capacité Java du convertisseur PDF en texte
  2. Importez des classes essentielles pour effectuer la transformation de documents de PDF en texte
  3. Créez une instance de la classe Converter et transmettez le fichier PDF d’entrée à son constructeur
  4. Créez un objet de la classe WordProcessingConvertOptions et définissez les paramètres de personnalisation du fichier texte de sortie
  5. Enfin, enregistrez le fichier texte résultant sur le disque en utilisant la méthode Convert

Les étapes ci-dessus vous aident à créer rapidement la fonctionnalité convertir PDF en texte Java. Vous pouvez démarrer le processus de conversion de document en initialisant la classe Converter après avoir configuré la bibliothèque requise et importé les classes nécessaires. Définissez ensuite le format de conversion du fichier texte de sortie en créant une instance de la classe WordProcessingConvertOptions. Au final, la méthode Convert vous permet d’enregistrer le document résultant sur le disque.

Code pour convertir un PDF en texte à l’aide de Java

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.licensing.License;
import com.groupdocs.conversion.options.convert.WordProcessingConvertOptions;
import com.groupdocs.conversion.filetypes.WordProcessingFileType;
public class ConvertPdfToTextUsingJava {
public static void main(String[] args) { // Main function to convert PDF to Text in Java
// Remove the watermark in output Text document by adding license
License lic = new License();
lic.setLicense("GroupDocs.Conversion.lic");
// Load the source PDF file for conversion to Text
Converter converter = new Converter("sample.pdf");
// Set the convert options for TXT format
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setFormat(WordProcessingFileType.Txt); // Specify the conversion format
// Convert and save the PDF in Text format
converter.convert("converted.txt", options);
System.out.println("Done");
}
}

Dans l’extrait de code précédent, vous pouvez voir comment * Java get Text from PDF * est implémenté pour effectuer la conversion de document avec seulement quelques appels d’API. Vous pouvez exécuter cet exemple de code sur n’importe quelle plate-forme telle que MS Windows, Linux et Mac OS sans installer d’outil tiers. Vous pouvez également modifier ce code selon vos besoins spécifiques.

Nous avons discuté des instructions détaillées pour développer la fonction Java de conversion de PDF en texte. Récemment, nous avons publié un article sur la conversion d’un document Word en image à l’aide de Java, consultez la publication comment convertir un document Word en image en Java pour plus d’informations.

 Français