Как преобразовать документ Word в текст на C#

В этой статье мы обсудим пошаговый процесс преобразования документа Word в Text на C#. В этом руководстве будет использоваться один из лучших API-интерфейсов конвертера документов для преобразования документов. Кроме того, в нем приведены инструкции по настройке необходимой библиотеки и показана реализация приложения C# Word to Text Converter. Более того, эти инструкции не зависят от платформы и могут использоваться в любой из широко используемых операционных систем, таких как Windows, Linux и macOS.

Действия по преобразованию документа Word в текст на C#

  1. Установите пакет GroupDocs.Conversion for .NET из диспетчера пакетов NuGet в приложении .NET, чтобы преобразовать документ Word в текст.
  2. Добавьте ссылку на пространство имен GroupDocs.Conversion для разработки функции преобразования Word в текст.
  3. Создайте экземпляр класса Converter для загрузки входного файла Word.
  4. Инициализируйте класс WordProcessingConvertOptions для определения параметров преобразования выходного текстового файла.
  5. Наконец, вызовите метод Convert для создания текста из Word и сохраните его на диске.

В приведенных выше шагах вы можете легко создать convert Word to Text с помощью функций C#, выполнив несколько вызовов API. После настройки пакета и импорта основных пространств имен класс Converter позволяет загрузить файл Word для преобразования в требуемый формат. Класс WordProcessingConvertOptions позволяет настроить преобразованный текстовый файл и сохранить выходной файл на диск, вызвав метод Convert.

Код для преобразования документа Word в текст на С#

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertWordDocumentToTextInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert Word document to Text using C#
{
// Remove the watermark in output Text document by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source Word file for conversion to Text
var converter = new GroupDocs.Conversion.Converter("sample.docx");
// Set the conversion options for Text document to customize the output file
WordProcessingConvertOptions options = new WordProcessingConvertOptions {
Format = GroupDocs.Conversion.FileTypes.WordProcessingFileType.Txt
};
// Convert and save the DOCX in TXT format
converter.Convert("converted.txt", options);
Console.WriteLine("Done");
}
}
}

Приведенный выше фрагмент кода демонстрирует реализацию convert Word to TXT в C#, следуя пошаговым инструкциям, описанным в предыдущем разделе. Несколько строк кода и пара вызовов API используются для завершения приложения для преобразования документа в указанный формат. Однако вы можете использовать этот образец кода в своих проектах как есть или изменить его, чтобы настроить преобразованный текстовый документ в соответствии с вашими конкретными требованиями с помощью объекта WordProcessingConvertOptions.

Мы обсудили процесс преобразования документа DOCX в формат TXT и разработали для него пример. Недавно мы опубликовали статью о преобразовании Excel в изображение с помощью C#. Дополнительные сведения см. в руководстве как преобразовать Excel в изображение в С#.

 Русский