Як перетворити документ Word на текст на C#

У цій статті ми обговоримо покроковий процес перетворення документа Word на Text на C#. У цьому посібнику буде використано один із найкращих API конвертера документів для виконання перетворення документів. Крім того, він містить інструкції щодо налаштування необхідної бібліотеки та показує реалізацію програми C# Word to Text converter. Крім того, ці інструкції не залежать від платформи та можуть використовуватися в будь-якій із широко використовуваних операційних систем, таких як Windows, Linux і macOS.

Кроки для перетворення документа Word на текст у C#

  1. Установіть пакет GroupDocs.Conversion for .NET із менеджера пакетів NuGet у програмі .NET, щоб конвертувати документ Word у текст
  2. Додайте посилання на простір імен GroupDocs.Conversion для розробки функції перетворення слова в текст
  3. Створіть екземпляр класу Converter для завантаження вхідного файлу Word
  4. Ініціалізуйте клас WordProcessingConvertOptions для визначення параметрів перетворення для вихідного текстового файлу
  5. Нарешті, викличте метод Convert для створення тексту з Word і збережіть його на диску

Виконуючи описані вище кроки, ви можете легко створити функцію перетворення Word на текст за допомогою C#, використавши кілька викликів API. Після налаштування пакета та імпортування основних просторів імен клас Converter дозволяє завантажити файл Word для перетворення в потрібний формат. Клас WordProcessingConvertOptions дає змогу налаштувати перетворений текстовий файл, і ви можете зберегти вихідний файл на диск, викликавши метод Convert.

Код для перетворення документа Word на текст у C#

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertWordDocumentToTextInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert Word document to Text using C#
{
// Remove the watermark in output Text document by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source Word file for conversion to Text
var converter = new GroupDocs.Conversion.Converter("sample.docx");
// Set the conversion options for Text document to customize the output file
WordProcessingConvertOptions options = new WordProcessingConvertOptions {
Format = GroupDocs.Conversion.FileTypes.WordProcessingFileType.Txt
};
// Convert and save the DOCX in TXT format
converter.Convert("converted.txt", options);
Console.WriteLine("Done");
}
}
}

Наведений вище фрагмент коду демонструє реалізацію перетворення Word на TXT у C# за допомогою покрокових інструкцій, пояснених у попередньому розділі. Кілька рядків коду та кілька викликів API використовуються для завершення програми для перетворення документа у вказаний формат. Однак ви можете використовувати цей зразок коду у своїх проектах у такому вигляді, як він є, або змінити його, щоб налаштувати перетворений текстовий документ відповідно до ваших конкретних вимог за допомогою об’єкта WordProcessingConvertOptions.

Ми обговорили процес перетворення документа DOCX у формат TXT і розробили для нього приклад. Нещодавно ми опублікували статтю про зміну Excel на Image за допомогою C#, перегляньте посібник як конвертувати Excel в зображення на C# для отримання додаткової інформації.

 Українська