Вилучення тексту з RTF за допомогою C#

Файли Rich Text Format (RTF) — це популярний формат документів, відомий своєю гнучкістю та широкою сумісністю з різними програмами обробки текстів. Вилучення тексту з файлів RTF може бути необхідним для виконання різних завдань, таких як аналіз даних, керування вмістом або автоматичне створення звітів. У цій статті ми розглянемо, як витягти текст із RTF за допомогою C# за допомогою бібліотеки Parser. Ми розглянемо необхідні кроки та надамо зразок коду, який допоможе вам інтегрувати цю функціональність у ваші проекти C#. Вилучення тексту з RTF у C# може допомогти вам обробити та використовувати вміст у різних контекстах, наприклад, конвертувати документи в інші формати, аналізувати вміст або автоматизувати створення звітів.

Кроки для вилучення тексту з RTF за допомогою C#

  1. Налаштуйте своє середовище розробки, включивши бібліотеку GroupDocs.Parser for .NET, яка дає змогу легко видобувати текст із файлів RTF
  2. Створіть екземпляр класу Parser і вкажіть шлях до вашого файлу RTF як частину процесу ініціалізації
  3. Викличте метод GetText екземпляра Parser, щоб отримати об’єкт TextReader, який використовуватиметься для доступу до текстового вмісту
  4. Викличте метод ReadToEnd для об’єкта TextReader, щоб отримати та прочитати повний текстовий вміст із файлу RTF

Цей процес може значно покращити вашу здатність обробляти вміст документів і керувати ним. Дотримуючись кроків, описаних у цьому посібнику, ви зможете ефективно виконувати вилучення тексту RTF у C#. Такий підхід гарантує, що ваші програми можуть легко обробляти текст із файлів RTF, що робить його цінним доповненням до програм обробки документів. Незалежно від того, чи працюєте ви над міграцією даних, аналізом вмісту чи автоматизованим звітуванням, опанування вилучення тексту RTF може оптимізувати робочі процеси та підвищити продуктивність.

Код для вилучення тексту з RTF за допомогою C#

using System;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Options;
namespace ExtractTextfromRTFusingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Apply the license to remove the limitations of the Parser library
License lic = new License();
lic.SetLicense(@"GroupDocs.Parser.lic");
// Instantiate the Parser class
using (Parser parser = new Parser("input.rtf"))
{
// Retrieve formatted text into the reader
using (TextReader reader = parser.GetFormattedText(
new FormattedTextOptions(FormattedTextMode.Html)))
{
// Output the formatted text from the document
// If formatted text extraction is not supported,
// the reader will be null
Console.WriteLine(reader == null ?
"Formatted text extraction isn't supported"
: reader.ReadToEnd());
Console.ReadLine();
}
}
}
}
}

Після того як ви встановили рекомендовану бібліотеку та вказали правильні шляхи до файлів, додавання наданого коду до ваших проектів буде простим. Процес вилучення тексту може значно покращити вашу здатність обробляти вміст документа та керувати ним. Ви можете ефективно виконувати операції C# читання тексту з RTF в операційних системах Windows, macOS і Linux без додаткового програмного забезпечення, крім .NET. Цей підхід гарантує, що ваші програми можуть легко обробляти текст із файлів RTF, що робить його цінним доповненням до вашого інструментарію обробки документів.

Раніше ми надавали детальний посібник із видобування тексту з файлів ODT за допомогою C#. Для більш детального вивчення, будь ласка, зверніться до нашого повного посібника про те, як витягти текст з ODT за допомогою C#.

 Українська