Att extrahera text från Excel-filer (XLS) är ett vanligt krav för utvecklare som arbetar med databearbetning, rapportgenerering eller informationshanteringsuppgifter. Excel-filer används ofta för att lagra och hantera stora mängder data. Ibland kan du behöva extrahera specifik information från dessa filer för att använda den i olika sammanhang, som att generera rapporter, utföra dataanalys eller migrera data till andra format. Genom att automatisera textextraktionsprocessen kan du spara tid och minska risken för manuella fel. I den här artikeln kommer vi att utforska hur man extraherar text från XLS med C#. Vi går igenom de nödvändiga stegen och tillhandahåller en exempelkod som hjälper dig att enkelt integrera denna funktion i dina C#-projekt. textextraktionen från XLS i C# är en enkel process när du följer stegen som beskrivs nedan.
Steg för att extrahera text från XLS med C#
- Förbered din utvecklingsmiljö genom att inkludera GroupDocs.Parser for .NET, som möjliggör textextraktion från XLS-filer
- Skapa en Parser-instans och ange sökvägen till din XLS-fil under initieringen
- Använd metoden GetText på Parser-instansen för att hämta ett TextReader-objekt
- Använd ReadToEnd-metoden på TextReader för att läsa hela textinnehållet från XLS-filen
De steg som beskrivs ovan fungerar sömlöst i Windows, macOS och Linux operativsystem utan att behöva någon extra programvara utöver vad som vanligtvis ingår i dessa plattformar. Denna metod förenklar inte bara utvecklingsprocessen utan förbättrar också portabiliteten för dina applikationer, vilket gör att de kan fungera konsekvent i olika miljöer. Flexibiliteten som erbjuds av XLS-textextraktion i C# innebär att du enkelt kan anpassa koden för att passa specifika projektkrav, oavsett om du har att göra med stora datamängder eller behöver automatisera rutinuppgifter. Följande kodexempel tillhandahålls för användning i dina program för att läsa text från XLS-filer.
Kod för att extrahera text från XLS med C#
using System; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Options; | |
namespace ExtractTextfromXLSusingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Apply the license to remove the limitations of the Parser library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Parser.lic"); | |
// Instantiate the Parser class | |
using (Parser parser = new Parser("input.xls")) | |
{ | |
// Retrieve formatted text into the reader | |
using (TextReader reader = parser.GetFormattedText( | |
new FormattedTextOptions(FormattedTextMode.Html))) | |
{ | |
// Output the formatted text from the document | |
// If formatted text extraction is not supported, | |
// the reader will be null | |
Console.WriteLine(reader == null ? | |
"Formatted text extraction isn't supported" | |
: reader.ReadToEnd()); | |
Console.ReadLine(); | |
} | |
} | |
} | |
} | |
} |
Efter att ha ställt in det rekommenderade biblioteket och konfigurerat filsökvägarna bör det vara enkelt att införliva den medföljande koden i dina projekt. Koden är enkel och okomplicerad. Att integrera C#-läs text från XLS i dina applikationer är enkelt, vilket gör att du enkelt kan hantera och bearbeta data som lagras i Excel-filer. Oavsett om du bygger ett dataanalysverktyg eller automatiserar rapportgenerering, kommer detta tillvägagångssätt att spara tid och ansträngning. Bra gjort! Du har framgångsrikt bemästrat processen att läsa text från XLS-filer med C#.
Tidigare gav vi en detaljerad guide för att extrahera text från PPT-filer med C#. För en mer grundlig undersökning, kolla in vår fullständiga handledning om hur du extrahera text från PPT med C#.