Comment convertir un document Word en texte en C#

Nous discuterons du processus étape par étape pour convertir un document Word en Text en C# dans cet article. Ce guide utilisera l’une des meilleures API de conversion de documents pour effectuer la transformation de documents. De plus, il fournit les instructions pour configurer la bibliothèque requise et vous montre la mise en œuvre de l’application C# Word to Text converter. De plus, ces instructions sont indépendantes de la plate-forme et peuvent être utilisées dans n’importe lequel des systèmes d’exploitation largement utilisés comme Windows, Linux et macOS.

Étapes pour convertir un document Word en texte en C#

  1. Installez le package GroupDocs.Conversion for .NET à partir du gestionnaire de packages NuGet dans l’application .NET pour convertir un document Word en texte
  2. Ajoutez une référence à l’espace de noms GroupDocs.Conversion pour développer la fonctionnalité de conversion Word to Text
  3. Instanciez la classe Converter pour charger le fichier Word d’entrée
  4. Initialiser la classe WordProcessingConvertOptions pour définir les options de conversion pour le fichier texte de sortie
  5. Enfin, appelez la méthode Convert pour générer du texte à partir de Word et stockez-le sur le disque

Dans les étapes ci-dessus, vous pouvez facilement créer la fonctionnalité convertir Word en texte à l’aide de C# en utilisant quelques appels d’API. Après avoir configuré le package et importé les espaces de noms essentiels, la classe Converter vous permet de charger le fichier Word pour le convertir au format requis. La classe WordProcessingConvertOptions vous permet de personnaliser le fichier texte converti et vous pouvez enregistrer le fichier de sortie sur le disque en appelant la méthode Convert.

Code pour convertir un document Word en texte en C

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertWordDocumentToTextInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert Word document to Text using C#
{
// Remove the watermark in output Text document by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source Word file for conversion to Text
var converter = new GroupDocs.Conversion.Converter("sample.docx");
// Set the conversion options for Text document to customize the output file
WordProcessingConvertOptions options = new WordProcessingConvertOptions {
Format = GroupDocs.Conversion.FileTypes.WordProcessingFileType.Txt
};
// Convert and save the DOCX in TXT format
converter.Convert("converted.txt", options);
Console.WriteLine("Done");
}
}
}

L’extrait de code ci-dessus illustre l’implémentation de convertir Word en TXT en C# en suivant les instructions détaillées expliquées dans la section précédente. Quelques lignes de code et quelques appels d’API sont utilisés pour compléter l’application de transformation du document au format spécifié. Cependant, vous pouvez utiliser cet exemple de code dans vos projets tel quel ou le modifier pour personnaliser le document texte converti selon vos besoins spécifiques à l’aide de l’objet WordProcessingConvertOptions.

Nous avons discuté du processus de conversion de documents de conversion du format DOCX au format TXT et développé un exemple pour cela. Récemment, nous avons publié un article pour changer Excel en image à l’aide de C#, consultez le guide comment convertir Excel en Image en C# pour plus d’informations.

 Français