Extrahování textu ze souborů aplikace Excel (XLS) je běžným požadavkem pro vývojáře pracující na úlohách zpracování dat, generování sestav nebo správy informací. Soubory Excel se často používají k ukládání a správě velkého množství dat. Někdy může být nutné extrahovat konkrétní informace z těchto souborů, abyste je mohli použít v různých kontextech, jako je generování sestav, provádění analýzy dat nebo migrace dat do jiných formátů. Automatizací procesu extrakce textu můžete ušetřit čas a snížit riziko ručních chyb. V tomto článku prozkoumáme, jak extrahovat text z XLS pomocí C#. Projdeme si nezbytné kroky a poskytneme vzorový kód, který vám pomůže snadno integrovat tuto funkci do vašich projektů C#. Extrakce textu z XLS v C# je jednoduchý proces, když budete postupovat podle kroků uvedených níže.
Kroky k extrahování textu z XLS pomocí C#
- Připravte své vývojové prostředí zahrnutím GroupDocs.Parser for .NET, které umožňuje extrakci textu ze souborů XLS
- Vytvořte instanci Parser a během inicializace zadejte cestu k souboru XLS
- Použijte metodu GetText na instanci Parser k načtení objektu TextReader
- K přečtení celého textového obsahu ze souboru XLS použijte metodu ReadToEnd na TextReaderu
Výše popsané kroky fungují bez problémů v různých operačních systémech Windows, macOS a Linux, aniž byste potřebovali další software nad rámec toho, co je obvykle součástí těchto platforem. Tato metoda nejen zjednodušuje proces vývoje, ale také zlepšuje přenositelnost vašich aplikací a umožňuje jim konzistentně fungovat v různých prostředích. Flexibilita, kterou nabízí XLS extrakce textu v C#, znamená, že můžete snadno přizpůsobit kód tak, aby vyhovoval konkrétním požadavkům projektu, ať už se zabýváte velkými datovými sadami nebo potřebujete automatizovat rutinní úlohy. Následující příklad kódu je k dispozici pro použití ve vašich aplikacích ke čtení textu ze souborů XLS.
Kód pro extrahování textu z XLS pomocí C#
using System; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Options; | |
namespace ExtractTextfromXLSusingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Apply the license to remove the limitations of the Parser library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Parser.lic"); | |
// Instantiate the Parser class | |
using (Parser parser = new Parser("input.xls")) | |
{ | |
// Retrieve formatted text into the reader | |
using (TextReader reader = parser.GetFormattedText( | |
new FormattedTextOptions(FormattedTextMode.Html))) | |
{ | |
// Output the formatted text from the document | |
// If formatted text extraction is not supported, | |
// the reader will be null | |
Console.WriteLine(reader == null ? | |
"Formatted text extraction isn't supported" | |
: reader.ReadToEnd()); | |
Console.ReadLine(); | |
} | |
} | |
} | |
} | |
} |
Po nastavení doporučené knihovny a konfiguraci cest k souborům by mělo být začlenění poskytnutého kódu do vašich projektů jednoduché. Kód je jednoduchý a přímočarý. Integrace C# čteného textu z XLS do vašich aplikací je přímočará a umožňuje vám snadno spravovat a zpracovávat data uložená v souborech aplikace Excel. Ať už vytváříte nástroj pro analýzu dat nebo automatizujete generování sestav, tento přístup vám ušetří čas a úsilí. Dobrá práce! Úspěšně jste zvládli proces čtení textu ze souborů XLS pomocí C#.
Dříve jsme poskytli podrobný průvodce extrahováním textu ze souborů PPT pomocí C#. Chcete-li důkladnější prozkoumání, podívejte se prosím na náš kompletní návod, jak extrahovat text z PPT pomocí C#.