A szöveg kibontása a XLSX fájlokból gyakori követelmény különféle adatfeldolgozási és elemzési feladatok során. Az XLSX fájlok, a táblázatok népszerű formátuma, rengeteg információt tartalmaznak, amelyeket gyakran el kell érni, elemezni kell vagy át kell vinni más rendszerekbe. A megfelelő könyvtárral, mint például a GroupDocs.Parser for .NET, a szövegkivonás XLSX-ből C#-ban egyszerű és rendkívül hatékony folyamat lesz. Ha megérti, hogyan lehet programozottan lekérni az adatokat ezekből a fájlokból, egyszerűsítheti munkafolyamatait és javíthatja adatkezelési feladatai hatékonyságát. Ez a cikk végigvezeti Önt a szöveg XLSX-ből C# használatával történő kibontásának legfontosabb lépésein.
Lépések a szöveg XLSX-ből C# használatával történő kibontásához
- Állítsa be fejlesztői környezetét a GroupDocs.Parser for .NET integrációjával, lehetővé téve a szövegkivonást az XLSX fájlokból
- Inicializálja a Parser osztályt, és adja át az XLSX fájl elérési útját argumentumként a konstruktornak
- Hívja a GetText metódust az Parser osztályból egy TextReader objektum lekéréséhez
- Végül használja a TextReader objektum ReadToEnd metódusát a kibontott szöveg eléréséhez
Kezdetben elengedhetetlen a fejlesztői környezet beállítása az Parser könyvtárral. Ez a nagy teljesítményű könyvtár átfogó funkcionalitást biztosít a különféle dokumentumformátumokkal való munkavégzéshez, beleértve az XLSX-et is. A környezet konfigurálása után az első lépés az Parser osztály egy példányának létrehozása, amely a szöveg kibontásának fő összetevőjeként szolgál. Az XLSX fájl elérési útjának megadásával az Parser osztály hozzáférhet a dokumentumhoz, és előkészítheti azt a szövegkivonathoz. A kibontási folyamat zökkenőmentes és hatékony, lehetővé téve a nagy és összetett XLSX-fájlok problémamentes kezelését. Az XLSX szövegkivonás eléréséhez C#-ban, az alábbi kódot használhatja alkalmazásaiban.
Kód a szöveg kinyeréséhez XLSX-ből C# használatával
using System; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Options; | |
namespace ExtractTextfromXLSXusingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Apply the license to remove the limitations of the Parser library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Parser.lic"); | |
// Instantiate the Parser class | |
using (Parser parser = new Parser("input.xlsx")) | |
{ | |
// Retrieve formatted text into the reader | |
using (TextReader reader = parser.GetFormattedText( | |
new FormattedTextOptions(FormattedTextMode.Html))) | |
{ | |
// Output the formatted text from the document | |
// If formatted text extraction is not supported, | |
// the reader will be null | |
Console.WriteLine(reader == null ? | |
"Formatted text extraction isn't supported" | |
: reader.ReadToEnd()); | |
Console.ReadLine(); | |
} | |
} | |
} | |
} | |
} |
A fenti kódpélda kompatibilis az olyan népszerű operációs rendszerekkel, mint a Windows, a macOS és a Linux, feltéve, hogy a .NET telepítve van. Nincs szükség további szoftvertelepítésekre. Az ajánlott könyvtár konfigurálása és a fájl elérési útjainak szükség szerinti módosítása után a megadott kód integrálása a projektekbe problémamentesen megy végbe. Összefoglalva, a C# szövegolvasás az XLSX-ből egy egyszerű és hatékony folyamat, amely nagymértékben javíthatja az adatkezelési és -elemzési képességeket. Ez a módszer megbízható megoldást kínál az XLSX-szövegkivonás integrálására az alkalmazásokba, megkönnyítve a táblázat adatainak kezelését és elemzését.
Korábban részletes útmutatót adtunk a DOCX-fájlok szövegének C#-val történő kinyeréséhez. Az alaposabb megértés érdekében javasoljuk, hogy tekintse meg kiterjedt oktatóanyagunkat a szöveg kibontása a DOCX-ből a C# használatával használatáról.