XLSX ֆայլերից տեքստ հանելը սովորական պահանջ է տվյալների մշակման և վերլուծության տարբեր առաջադրանքներում: XLSX ֆայլերը՝ աղյուսակների հանրաճանաչ ձևաչափը, պարունակում են բազմաթիվ տեղեկություններ, որոնց հաճախ անհրաժեշտ է մուտք գործել, վերլուծել կամ փոխանցել այլ համակարգեր: Ճիշտ գրադարանով, ինչպիսին է GroupDocs.Parser-ը .NET-ի համար, XLSX-ից տեքստի հանումը C#-ով դառնում է պարզ և շատ արդյունավետ գործընթաց: Հասկանալով, թե ինչպես կարելի է ծրագրային կերպով առբերել տվյալներ այս ֆայլերից, դուք կարող եք պարզեցնել ձեր աշխատանքային հոսքերը և բարձրացնել ձեր տվյալների կառավարման առաջադրանքների արդյունավետությունը: Այս հոդվածը կուղղորդի ձեզ առանցքային քայլերի միջոցով, որոնք ներառում են, թե ինչպես արտահանել տեքստ XLSX-ից՝ օգտագործելով C#:
XLSX-ից C#-ով տեքստ հանելու քայլեր
- Կարգավորեք ձեր զարգացման միջավայրը՝ ինտեգրելով GroupDocs.Parser for .NET-ը՝ հնարավորություն տալով տեքստի արտահանումը XLSX ֆայլերից
- Նախաձեռնեք Parser դասը` փոխանցելով ձեր XLSX ֆայլի ուղին որպես արգումենտ կոնստրուկտորին:
- Կանչեք GetText մեթոդը Parser դասից՝ TextReader օբյեկտը ստանալու համար
- Վերջապես, օգտագործեք «TextReader» օբյեկտի ReadToEnd մեթոդը՝ արդյունահանված տեքստը մուտք գործելու համար
Սկսելու համար, ձեր զարգացման միջավայրի կարգավորումը Parser գրադարանի միջոցով կարևոր է: Այս հզոր գրադարանը տրամադրում է համապարփակ գործառույթ՝ տարբեր փաստաթղթերի ձևաչափերով աշխատելու համար, ներառյալ XLSX-ը: Երբ ձեր միջավայրը կազմաձևվի, առաջին քայլը Parser դասի օրինակ ստեղծելն է, որը ծառայում է որպես տեքստի արդյունահանման հիմնական բաղադրիչ: Տրամադրելով XLSX ֆայլի ուղին, Parser դասը կարող է մուտք գործել փաստաթուղթ և պատրաստել այն տեքստի արդյունահանման համար: Արդյունահանման գործընթացը անխափան և արդյունավետ է, ինչը թույլ է տալիս առանց որևէ խոչընդոտի կառավարել նույնիսկ խոշոր և բարդ XLSX ֆայլերը: XLSX տեքստի արդյունահանման հասնելու համար C#-ով, կարող եք օգտագործել ստորև նշված կոդը ձեր հավելվածներում:
Կոդ՝ XLSX-ից C#-ով տեքստ հանելու համար
using System; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Options; | |
namespace ExtractTextfromXLSXusingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Apply the license to remove the limitations of the Parser library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Parser.lic"); | |
// Instantiate the Parser class | |
using (Parser parser = new Parser("input.xlsx")) | |
{ | |
// Retrieve formatted text into the reader | |
using (TextReader reader = parser.GetFormattedText( | |
new FormattedTextOptions(FormattedTextMode.Html))) | |
{ | |
// Output the formatted text from the document | |
// If formatted text extraction is not supported, | |
// the reader will be null | |
Console.WriteLine(reader == null ? | |
"Formatted text extraction isn't supported" | |
: reader.ReadToEnd()); | |
Console.ReadLine(); | |
} | |
} | |
} | |
} | |
} |
Վերոնշյալ կոդի օրինակը համատեղելի է հայտնի օպերացիոն համակարգերի հետ, ինչպիսիք են Windows-ը, macOS-ը և Linux-ը, պայմանով, որ .NET-ը տեղադրված է: Լրացուցիչ ծրագրերի տեղադրման կարիք չկա: Առաջարկվող գրադարանը կարգավորելուց և անհրաժեշտության դեպքում ֆայլերի ուղիները կարգավորելուց հետո տրամադրված կոդը ձեր նախագծերում ինտեգրելը պետք է սահուն ընթանա առանց որևէ խնդիրների: Եզրափակելով, XLSX-ից *C# կարդալու տեքստը պարզ և արդյունավետ գործընթաց է, որը կարող է մեծապես բարելավել ձեր տվյալների մշակման և վերլուծության հնարավորությունները: Այս մեթոդը հուսալի լուծում է տալիս XLSX տեքստի արդյունահանումը ձեր հավելվածներում ինտեգրելու համար՝ հեշտացնելով կառավարել և վերլուծել ձեր աղյուսակի տվյալները:
Նախկինում մենք մանրամասն ուղեցույց էինք տրամադրել DOCX ֆայլերից C#-ով տեքստ հանելու վերաբերյալ: Ավելի մանրամասն հասկանալու համար մենք առաջարկում ենք ուսումնասիրել մեր ընդարձակ ձեռնարկը, թե ինչպես անել հանել տեքստը DOCX-ից՝ օգտագործելով C#: