Քաղեք տեքստ RTF-ից՝ օգտագործելով C#

Rich Text Format (RTF) ֆայլերը փաստաթղթի հանրաճանաչ ձևաչափ են, որը հայտնի է իրենց ճկունությամբ և լայն համատեղելիությամբ տարբեր բառերի մշակման ծրագրերում: RTF ֆայլերից տեքստի դուրսբերումը կարող է կարևոր լինել տարբեր խնդիրների համար, ինչպիսիք են տվյալների վերլուծությունը, բովանդակության կառավարումը կամ ավտոմատացված հաշվետվությունների ստեղծումը: Այս հոդվածում մենք կուսումնասիրենք, թե ինչպես արտահանել տեքստ RTF-ից՝ օգտագործելով C#՝ օգտագործելով Parser գրադարանը: Մենք կներառենք անհրաժեշտ քայլերը և կտրամադրենք օրինակելի կոդը, որը կօգնի ձեզ ինտեգրել այս գործառույթը ձեր C# նախագծերում: Տեքստի արդյունահանումը RTF-ից C#-ով կարող է օգնել ձեզ մշակել և օգտագործել բովանդակությունը տարբեր համատեքստերում, ինչպիսիք են փաստաթղթերը այլ ձևաչափերի փոխակերպելը, բովանդակությունը վերլուծելը կամ հաշվետվությունների ստեղծման ավտոմատացումը:

Քայլեր RTF-ից տեքստ հանելու համար՝ օգտագործելով C#

  1. Կազմաձևեք ձեր զարգացման միջավայրը՝ ներառելով GroupDocs.Parser for .NET գրադարանը, որը թույլ է տալիս անխափան կերպով տեքստ հանել RTF ֆայլերից:
  2. Ստեղծեք Parser դասի օրինակ և նշեք ձեր RTF ֆայլի ուղին որպես սկզբնավորման գործընթացի մաս:
  3. Զանգահարեք GetText մեթոդը Parser օրինակի վրա՝ առբերելու TextReader օբյեկտ, որը կօգտագործվի տեքստային բովանդակություն մուտք գործելու համար:
  4. Զանգահարեք ReadToEnd մեթոդը TextReader օբյեկտի վրա՝ RTF ֆայլից տեքստի ամբողջական բովանդակությունը հանելու և կարդալու համար:

Այս գործընթացը կարող է զգալիորեն բարելավել փաստաթղթերի բովանդակությունը մշակելու և կառավարելու ձեր ունակությունը: Հետևելով այս ուղեցույցում նշված քայլերին, դուք կարող եք արդյունավետ կերպով կատարել RTF տեքստի արդյունահանումը C#-ով: Այս մոտեցումը երաշխավորում է, որ ձեր հավելվածները կարող են հեշտությամբ մշակել RTF ֆայլերի տեքստը՝ այն դարձնելով արժեքավոր հավելում ձեր փաստաթղթերի մշակման հավելվածներում: Անկախ նրանից, թե դուք աշխատում եք տվյալների միգրացիայի, բովանդակության վերլուծության կամ ավտոմատացված հաշվետվությունների վրա, RTF տեքստի արդյունահանման յուրացումը կարող է հեշտացնել ձեր աշխատանքային հոսքերը և բարելավել արտադրողականությունը:

Կոդ՝ RTF-ից տեքստ հանելու համար՝ օգտագործելով C#

using System;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Options;
namespace ExtractTextfromRTFusingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Apply the license to remove the limitations of the Parser library
License lic = new License();
lic.SetLicense(@"GroupDocs.Parser.lic");
// Instantiate the Parser class
using (Parser parser = new Parser("input.rtf"))
{
// Retrieve formatted text into the reader
using (TextReader reader = parser.GetFormattedText(
new FormattedTextOptions(FormattedTextMode.Html)))
{
// Output the formatted text from the document
// If formatted text extraction is not supported,
// the reader will be null
Console.WriteLine(reader == null ?
"Formatted text extraction isn't supported"
: reader.ReadToEnd());
Console.ReadLine();
}
}
}
}
}

Առաջարկվող գրադարանը տեղադրելուց և ֆայլի ճիշտ ուղիները սահմանելուց հետո տրամադրված կոդը ձեր նախագծերին ավելացնելը պարզ կլինի: Տեքստի արդյունահանման գործընթացը կարող է զգալիորեն բարելավել փաստաթղթի բովանդակությունը մշակելու և կառավարելու ձեր ունակությունը: Դուք կարող եք արդյունավետ կերպով կատարել C# կարդալ տեքստը RTF օպերացիոն համակարգերից Windows, macOS և Linux օպերացիոն համակարգերում՝ առանց լրացուցիչ ծրագրերի, բացառությամբ .NET-ի: Այս մոտեցումը երաշխավորում է, որ ձեր հավելվածները կարող են հեշտությամբ մշակել RTF ֆայլերի տեքստը՝ այն դարձնելով արժեքավոր հավելում ձեր փաստաթղթերի մշակման գործիքակազմում:

Նախկինում մենք մանրամասն ուղեցույց էինք տրամադրել ODT ֆայլերից C#-ով տեքստ հանելու վերաբերյալ: Ավելի մանրամասն ուսումնասիրության համար խնդրում ենք ծանոթանալ մեր ամբողջական ձեռնարկին, թե ինչպես կատարել հանել տեքստը ODT-ից՝ օգտագործելով C#:

 Հայերեն