Извлечение текста из файлов Excel (XLS) является распространенным требованием для разработчиков, работающих над задачами обработки данных, создания отчетов или управления информацией. Файлы Excel часто используются для хранения и управления большими объемами данных. Иногда вам может потребоваться извлечь определенную информацию из этих файлов, чтобы использовать ее в различных контекстах, таких как создание отчетов, выполнение анализа данных или перенос данных в другие форматы. Автоматизируя процесс извлечения текста, вы можете сэкономить время и снизить риск ручных ошибок. В этой статье мы рассмотрим, как извлечь текст из XLS с помощью C#. Мы рассмотрим необходимые шаги и предоставим пример кода, который поможет вам легко интегрировать эту функцию в ваши проекты C#. Извлечение текста из XLS в C# — это простой процесс, если вы выполните шаги, описанные ниже.
Шаги по извлечению текста из XLS с помощью C#
- Подготовьте среду разработки, включив GroupDocs.Parser for .NET, что позволяет извлекать текст из файлов XLS.
- Создайте экземпляр Parser и укажите путь к вашему XLS-файлу во время инициализации.
- Используйте метод GetText в экземпляре Parser для извлечения объекта TextReader.
- Используйте метод ReadToEnd в TextReader для чтения всего текстового содержимого из файла XLS.
Описанные выше шаги работают без проблем в операционных системах Windows, macOS и Linux без необходимости использования какого-либо дополнительного программного обеспечения, выходящего за рамки того, что обычно включено в эти платформы. Этот метод не только упрощает процесс разработки, но и повышает переносимость ваших приложений, позволяя им функционировать согласованно в различных средах. Гибкость, предлагаемая извлечением текста XLS в C#, означает, что вы можете легко адаптировать код в соответствии с конкретными требованиями проекта, независимо от того, имеете ли вы дело с большими наборами данных или вам нужно автоматизировать рутинные задачи. Следующий пример кода предоставляется для использования в ваших приложениях для чтения текста из файлов XLS.
Код для извлечения текста из XLS с использованием C#
using System; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Options; | |
namespace ExtractTextfromXLSusingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Apply the license to remove the limitations of the Parser library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Parser.lic"); | |
// Instantiate the Parser class | |
using (Parser parser = new Parser("input.xls")) | |
{ | |
// Retrieve formatted text into the reader | |
using (TextReader reader = parser.GetFormattedText( | |
new FormattedTextOptions(FormattedTextMode.Html))) | |
{ | |
// Output the formatted text from the document | |
// If formatted text extraction is not supported, | |
// the reader will be null | |
Console.WriteLine(reader == null ? | |
"Formatted text extraction isn't supported" | |
: reader.ReadToEnd()); | |
Console.ReadLine(); | |
} | |
} | |
} | |
} | |
} |
После настройки рекомендуемой библиотеки и настройки путей к файлам включение предоставленного кода в ваши проекты должно быть простым. Код простой и понятный. Интеграция C# чтения текста из XLS в ваши приложения проста, что позволяет вам легко управлять и обрабатывать данные, хранящиеся в файлах Excel. Независимо от того, создаете ли вы инструмент анализа данных или автоматизируете генерацию отчетов, этот подход сэкономит вам время и усилия. Молодец! Вы успешно освоили процесс чтения текста из файлов XLS с помощью C#.
Ранее мы предоставили подробное руководство по извлечению текста из файлов PPT с использованием C#. Для более тщательного изучения, пожалуйста, ознакомьтесь с нашим полным руководством о том, как извлечь текст из PPT с помощью C#.