Extrahujte text z XLS pomocí C#

Extrahování textu ze souborů aplikace Excel (XLS) je běžným požadavkem pro vývojáře pracující na úlohách zpracování dat, generování sestav nebo správy informací. Soubory Excel se často používají k ukládání a správě velkého množství dat. Někdy může být nutné extrahovat konkrétní informace z těchto souborů, abyste je mohli použít v různých kontextech, jako je generování sestav, provádění analýzy dat nebo migrace dat do jiných formátů. Automatizací procesu extrakce textu můžete ušetřit čas a snížit riziko ručních chyb. V tomto článku prozkoumáme, jak extrahovat text z XLS pomocí C#. Projdeme si nezbytné kroky a poskytneme vzorový kód, který vám pomůže snadno integrovat tuto funkci do vašich projektů C#. Extrakce textu z XLS v C# je jednoduchý proces, když budete postupovat podle kroků uvedených níže.

Kroky k extrahování textu z XLS pomocí C#

  1. Připravte své vývojové prostředí zahrnutím GroupDocs.Parser for .NET, které umožňuje extrakci textu ze souborů XLS
  2. Vytvořte instanci Parser a během inicializace zadejte cestu k souboru XLS
  3. Použijte metodu GetText na instanci Parser k načtení objektu TextReader
  4. K přečtení celého textového obsahu ze souboru XLS použijte metodu ReadToEnd na TextReaderu

Výše popsané kroky fungují bez problémů v různých operačních systémech Windows, macOS a Linux, aniž byste potřebovali další software nad rámec toho, co je obvykle součástí těchto platforem. Tato metoda nejen zjednodušuje proces vývoje, ale také zlepšuje přenositelnost vašich aplikací a umožňuje jim konzistentně fungovat v různých prostředích. Flexibilita, kterou nabízí XLS extrakce textu v C#, znamená, že můžete snadno přizpůsobit kód tak, aby vyhovoval konkrétním požadavkům projektu, ať už se zabýváte velkými datovými sadami nebo potřebujete automatizovat rutinní úlohy. Následující příklad kódu je k dispozici pro použití ve vašich aplikacích ke čtení textu ze souborů XLS.

Kód pro extrahování textu z XLS pomocí C#

using System;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Options;
namespace ExtractTextfromXLSusingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Apply the license to remove the limitations of the Parser library
License lic = new License();
lic.SetLicense(@"GroupDocs.Parser.lic");
// Instantiate the Parser class
using (Parser parser = new Parser("input.xls"))
{
// Retrieve formatted text into the reader
using (TextReader reader = parser.GetFormattedText(
new FormattedTextOptions(FormattedTextMode.Html)))
{
// Output the formatted text from the document
// If formatted text extraction is not supported,
// the reader will be null
Console.WriteLine(reader == null ?
"Formatted text extraction isn't supported"
: reader.ReadToEnd());
Console.ReadLine();
}
}
}
}
}

Po nastavení doporučené knihovny a konfiguraci cest k souborům by mělo být začlenění poskytnutého kódu do vašich projektů jednoduché. Kód je jednoduchý a přímočarý. Integrace C# čteného textu z XLS do vašich aplikací je přímočará a umožňuje vám snadno spravovat a zpracovávat data uložená v souborech aplikace Excel. Ať už vytváříte nástroj pro analýzu dat nebo automatizujete generování sestav, tento přístup vám ušetří čas a úsilí. Dobrá práce! Úspěšně jste zvládli proces čtení textu ze souborů XLS pomocí C#.

Dříve jsme poskytli podrobný průvodce extrahováním textu ze souborů PPT pomocí C#. Chcete-li důkladnější prozkoumání, podívejte se prosím na náš kompletní návod, jak extrahovat text z PPT pomocí C#.

 Čeština