Извлечение текста из XLS с помощью C#

Извлечение текста из файлов Excel (XLS) является распространенным требованием для разработчиков, работающих над задачами обработки данных, создания отчетов или управления информацией. Файлы Excel часто используются для хранения и управления большими объемами данных. Иногда вам может потребоваться извлечь определенную информацию из этих файлов, чтобы использовать ее в различных контекстах, таких как создание отчетов, выполнение анализа данных или перенос данных в другие форматы. Автоматизируя процесс извлечения текста, вы можете сэкономить время и снизить риск ручных ошибок. В этой статье мы рассмотрим, как извлечь текст из XLS с помощью C#. Мы рассмотрим необходимые шаги и предоставим пример кода, который поможет вам легко интегрировать эту функцию в ваши проекты C#. Извлечение текста из XLS в C# — это простой процесс, если вы выполните шаги, описанные ниже.

Шаги по извлечению текста из XLS с помощью C#

  1. Подготовьте среду разработки, включив GroupDocs.Parser for .NET, что позволяет извлекать текст из файлов XLS.
  2. Создайте экземпляр Parser и укажите путь к вашему XLS-файлу во время инициализации.
  3. Используйте метод GetText в экземпляре Parser для извлечения объекта TextReader.
  4. Используйте метод ReadToEnd в TextReader для чтения всего текстового содержимого из файла XLS.

Описанные выше шаги работают без проблем в операционных системах Windows, macOS и Linux без необходимости использования какого-либо дополнительного программного обеспечения, выходящего за рамки того, что обычно включено в эти платформы. Этот метод не только упрощает процесс разработки, но и повышает переносимость ваших приложений, позволяя им функционировать согласованно в различных средах. Гибкость, предлагаемая извлечением текста XLS в C#, означает, что вы можете легко адаптировать код в соответствии с конкретными требованиями проекта, независимо от того, имеете ли вы дело с большими наборами данных или вам нужно автоматизировать рутинные задачи. Следующий пример кода предоставляется для использования в ваших приложениях для чтения текста из файлов XLS.

Код для извлечения текста из XLS с использованием C#

using System;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Options;
namespace ExtractTextfromXLSusingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Apply the license to remove the limitations of the Parser library
License lic = new License();
lic.SetLicense(@"GroupDocs.Parser.lic");
// Instantiate the Parser class
using (Parser parser = new Parser("input.xls"))
{
// Retrieve formatted text into the reader
using (TextReader reader = parser.GetFormattedText(
new FormattedTextOptions(FormattedTextMode.Html)))
{
// Output the formatted text from the document
// If formatted text extraction is not supported,
// the reader will be null
Console.WriteLine(reader == null ?
"Formatted text extraction isn't supported"
: reader.ReadToEnd());
Console.ReadLine();
}
}
}
}
}

После настройки рекомендуемой библиотеки и настройки путей к файлам включение предоставленного кода в ваши проекты должно быть простым. Код простой и понятный. Интеграция C# чтения текста из XLS в ваши приложения проста, что позволяет вам легко управлять и обрабатывать данные, хранящиеся в файлах Excel. Независимо от того, создаете ли вы инструмент анализа данных или автоматизируете генерацию отчетов, этот подход сэкономит вам время и усилия. Молодец! Вы успешно освоили процесс чтения текста из файлов XLS с помощью C#.

Ранее мы предоставили подробное руководство по извлечению текста из файлов PPT с использованием C#. Для более тщательного изучения, пожалуйста, ознакомьтесь с нашим полным руководством о том, как извлечь текст из PPT с помощью C#.

 Русский