Քաղեք տեքստ XLSX-ից՝ օգտագործելով C#

XLSX ֆայլերից տեքստ հանելը սովորական պահանջ է տվյալների մշակման և վերլուծության տարբեր առաջադրանքներում: XLSX ֆայլերը՝ աղյուսակների հանրաճանաչ ձևաչափը, պարունակում են բազմաթիվ տեղեկություններ, որոնց հաճախ անհրաժեշտ է մուտք գործել, վերլուծել կամ փոխանցել այլ համակարգեր: Ճիշտ գրադարանով, ինչպիսին է GroupDocs.Parser-ը .NET-ի համար, XLSX-ից տեքստի հանումը C#-ով դառնում է պարզ և շատ արդյունավետ գործընթաց: Հասկանալով, թե ինչպես կարելի է ծրագրային կերպով առբերել տվյալներ այս ֆայլերից, դուք կարող եք պարզեցնել ձեր աշխատանքային հոսքերը և բարձրացնել ձեր տվյալների կառավարման առաջադրանքների արդյունավետությունը: Այս հոդվածը կուղղորդի ձեզ առանցքային քայլերի միջոցով, որոնք ներառում են, թե ինչպես արտահանել տեքստ XLSX-ից՝ օգտագործելով C#:

XLSX-ից C#-ով տեքստ հանելու քայլեր

  1. Կարգավորեք ձեր զարգացման միջավայրը՝ ինտեգրելով GroupDocs.Parser for .NET-ը՝ հնարավորություն տալով տեքստի արտահանումը XLSX ֆայլերից
  2. Նախաձեռնեք Parser դասը` փոխանցելով ձեր XLSX ֆայլի ուղին որպես արգումենտ կոնստրուկտորին:
  3. Կանչեք GetText մեթոդը Parser դասից՝ TextReader օբյեկտը ստանալու համար
  4. Վերջապես, օգտագործեք «TextReader» օբյեկտի ReadToEnd մեթոդը՝ արդյունահանված տեքստը մուտք գործելու համար

Սկսելու համար, ձեր զարգացման միջավայրի կարգավորումը Parser գրադարանի միջոցով կարևոր է: Այս հզոր գրադարանը տրամադրում է համապարփակ գործառույթ՝ տարբեր փաստաթղթերի ձևաչափերով աշխատելու համար, ներառյալ XLSX-ը: Երբ ձեր միջավայրը կազմաձևվի, առաջին քայլը Parser դասի օրինակ ստեղծելն է, որը ծառայում է որպես տեքստի արդյունահանման հիմնական բաղադրիչ: Տրամադրելով XLSX ֆայլի ուղին, Parser դասը կարող է մուտք գործել փաստաթուղթ և պատրաստել այն տեքստի արդյունահանման համար: Արդյունահանման գործընթացը անխափան և արդյունավետ է, ինչը թույլ է տալիս առանց որևէ խոչընդոտի կառավարել նույնիսկ խոշոր և բարդ XLSX ֆայլերը: XLSX տեքստի արդյունահանման հասնելու համար C#-ով, կարող եք օգտագործել ստորև նշված կոդը ձեր հավելվածներում:

Կոդ՝ XLSX-ից C#-ով տեքստ հանելու համար

using System;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Options;
namespace ExtractTextfromXLSXusingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Apply the license to remove the limitations of the Parser library
License lic = new License();
lic.SetLicense(@"GroupDocs.Parser.lic");
// Instantiate the Parser class
using (Parser parser = new Parser("input.xlsx"))
{
// Retrieve formatted text into the reader
using (TextReader reader = parser.GetFormattedText(
new FormattedTextOptions(FormattedTextMode.Html)))
{
// Output the formatted text from the document
// If formatted text extraction is not supported,
// the reader will be null
Console.WriteLine(reader == null ?
"Formatted text extraction isn't supported"
: reader.ReadToEnd());
Console.ReadLine();
}
}
}
}
}

Վերոնշյալ կոդի օրինակը համատեղելի է հայտնի օպերացիոն համակարգերի հետ, ինչպիսիք են Windows-ը, macOS-ը և Linux-ը, պայմանով, որ .NET-ը տեղադրված է: Լրացուցիչ ծրագրերի տեղադրման կարիք չկա: Առաջարկվող գրադարանը կարգավորելուց և անհրաժեշտության դեպքում ֆայլերի ուղիները կարգավորելուց հետո տրամադրված կոդը ձեր նախագծերում ինտեգրելը պետք է սահուն ընթանա առանց որևէ խնդիրների: Եզրափակելով, XLSX-ից *C# կարդալու տեքստը պարզ և արդյունավետ գործընթաց է, որը կարող է մեծապես բարելավել ձեր տվյալների մշակման և վերլուծության հնարավորությունները: Այս մեթոդը հուսալի լուծում է տալիս XLSX տեքստի արդյունահանումը ձեր հավելվածներում ինտեգրելու համար՝ հեշտացնելով կառավարել և վերլուծել ձեր աղյուսակի տվյալները:

Նախկինում մենք մանրամասն ուղեցույց էինք տրամադրել DOCX ֆայլերից C#-ով տեքստ հանելու վերաբերյալ: Ավելի մանրամասն հասկանալու համար մենք առաջարկում ենք ուսումնասիրել մեր ընդարձակ ձեռնարկը, թե ինչպես անել հանել տեքստը DOCX-ից՝ օգտագործելով C#:

 Հայերեն