Szöveg kibontása az XLSX-ből a C# használatával

A szöveg kibontása a XLSX fájlokból gyakori követelmény különféle adatfeldolgozási és elemzési feladatok során. Az XLSX fájlok, a táblázatok népszerű formátuma, rengeteg információt tartalmaznak, amelyeket gyakran el kell érni, elemezni kell vagy át kell vinni más rendszerekbe. A megfelelő könyvtárral, mint például a GroupDocs.Parser for .NET, a szövegkivonás XLSX-ből C#-ban egyszerű és rendkívül hatékony folyamat lesz. Ha megérti, hogyan lehet programozottan lekérni az adatokat ezekből a fájlokból, egyszerűsítheti munkafolyamatait és javíthatja adatkezelési feladatai hatékonyságát. Ez a cikk végigvezeti Önt a szöveg XLSX-ből C# használatával történő kibontásának legfontosabb lépésein.

Lépések a szöveg XLSX-ből C# használatával történő kibontásához

  1. Állítsa be fejlesztői környezetét a GroupDocs.Parser for .NET integrációjával, lehetővé téve a szövegkivonást az XLSX fájlokból
  2. Inicializálja a Parser osztályt, és adja át az XLSX fájl elérési útját argumentumként a konstruktornak
  3. Hívja a GetText metódust az Parser osztályból egy TextReader objektum lekéréséhez
  4. Végül használja a TextReader objektum ReadToEnd metódusát a kibontott szöveg eléréséhez

Kezdetben elengedhetetlen a fejlesztői környezet beállítása az Parser könyvtárral. Ez a nagy teljesítményű könyvtár átfogó funkcionalitást biztosít a különféle dokumentumformátumokkal való munkavégzéshez, beleértve az XLSX-et is. A környezet konfigurálása után az első lépés az Parser osztály egy példányának létrehozása, amely a szöveg kibontásának fő összetevőjeként szolgál. Az XLSX fájl elérési útjának megadásával az Parser osztály hozzáférhet a dokumentumhoz, és előkészítheti azt a szövegkivonathoz. A kibontási folyamat zökkenőmentes és hatékony, lehetővé téve a nagy és összetett XLSX-fájlok problémamentes kezelését. Az XLSX szövegkivonás eléréséhez C#-ban, az alábbi kódot használhatja alkalmazásaiban.

Kód a szöveg kinyeréséhez XLSX-ből C# használatával

using System;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Options;
namespace ExtractTextfromXLSXusingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Apply the license to remove the limitations of the Parser library
License lic = new License();
lic.SetLicense(@"GroupDocs.Parser.lic");
// Instantiate the Parser class
using (Parser parser = new Parser("input.xlsx"))
{
// Retrieve formatted text into the reader
using (TextReader reader = parser.GetFormattedText(
new FormattedTextOptions(FormattedTextMode.Html)))
{
// Output the formatted text from the document
// If formatted text extraction is not supported,
// the reader will be null
Console.WriteLine(reader == null ?
"Formatted text extraction isn't supported"
: reader.ReadToEnd());
Console.ReadLine();
}
}
}
}
}

A fenti kódpélda kompatibilis az olyan népszerű operációs rendszerekkel, mint a Windows, a macOS és a Linux, feltéve, hogy a .NET telepítve van. Nincs szükség további szoftvertelepítésekre. Az ajánlott könyvtár konfigurálása és a fájl elérési útjainak szükség szerinti módosítása után a megadott kód integrálása a projektekbe problémamentesen megy végbe. Összefoglalva, a C# szövegolvasás az XLSX-ből egy egyszerű és hatékony folyamat, amely nagymértékben javíthatja az adatkezelési és -elemzési képességeket. Ez a módszer megbízható megoldást kínál az XLSX-szövegkivonás integrálására az alkalmazásokba, megkönnyítve a táblázat adatainak kezelését és elemzését.

Korábban részletes útmutatót adtunk a DOCX-fájlok szövegének C#-val történő kinyeréséhez. Az alaposabb megértés érdekében javasoljuk, hogy tekintse meg kiterjedt oktatóanyagunkat a szöveg kibontása a DOCX-ből a C# használatával használatáról.

 Magyar