Вилучення тексту з файлів Excel (XLS) є загальною вимогою для розробників, які працюють над обробкою даних, створенням звітів або завданнями керування інформацією. Файли Excel часто використовуються для зберігання великих обсягів даних і керування ними. Іноді вам може знадобитися витягти певну інформацію з цих файлів, щоб використовувати її в різних контекстах, наприклад для створення звітів, виконання аналізу даних або перенесення даних в інші формати. Автоматизувавши процес вилучення тексту, ви можете заощадити час і знизити ризик помилок, зроблених вручну. У цій статті ми розглянемо, як витягнути текст із XLS за допомогою C#. Ми розповімо про необхідні кроки та надамо зразок коду, який допоможе вам легко інтегрувати цю функціональність у ваші проекти C#. Вилучення тексту з XLS у C# є простим процесом, якщо ви виконуєте кроки, описані нижче.
Кроки для вилучення тексту з XLS за допомогою C#
- Підготуйте своє середовище розробки, включивши GroupDocs.Parser for .NET, що дозволяє видобувати текст із файлів XLS
- Створіть екземпляр Parser і вкажіть шлях до вашого файлу XLS під час ініціалізації
- Використовуйте метод GetText екземпляра Parser, щоб отримати об’єкт TextReader
- Використовуйте метод ReadToEnd у TextReader, щоб прочитати весь текстовий вміст із файлу XLS
Описані вище кроки безперебійно працюють в операційних системах Windows, macOS і Linux без потреби в будь-якому додатковому програмному забезпеченні, окрім того, що зазвичай входить до складу цих платформ. Цей метод не тільки спрощує процес розробки, але й покращує портативність ваших програм, дозволяючи їм узгоджено функціонувати в різних середовищах. Гнучкість, яку пропонує вилучення тексту XLS у C#, означає, що ви можете легко адаптувати код відповідно до конкретних вимог проекту, незалежно від того, чи маєте ви справу з великими наборами даних чи вам потрібно автоматизувати рутинні завдання. Наступний приклад коду надається для використання у ваших програмах для читання тексту з файлів XLS.
Код для вилучення тексту з XLS за допомогою C#
using System; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Options; | |
namespace ExtractTextfromXLSusingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Apply the license to remove the limitations of the Parser library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Parser.lic"); | |
// Instantiate the Parser class | |
using (Parser parser = new Parser("input.xls")) | |
{ | |
// Retrieve formatted text into the reader | |
using (TextReader reader = parser.GetFormattedText( | |
new FormattedTextOptions(FormattedTextMode.Html))) | |
{ | |
// Output the formatted text from the document | |
// If formatted text extraction is not supported, | |
// the reader will be null | |
Console.WriteLine(reader == null ? | |
"Formatted text extraction isn't supported" | |
: reader.ReadToEnd()); | |
Console.ReadLine(); | |
} | |
} | |
} | |
} | |
} |
Після налаштування рекомендованої бібліотеки та налаштування шляхів до файлів включення наданого коду у ваші проекти має бути простим. Код простий і зрозумілий. Інтеграція тексту C#, зчитованого з XLS, у ваші програми є простою, що дозволяє легко керувати та обробляти дані, що зберігаються у файлах Excel. Незалежно від того, створюєте ви інструмент аналізу даних чи автоматизуєте створення звітів, цей підхід заощадить ваш час і зусилля. молодець! Ви успішно освоїли процес читання тексту з файлів XLS за допомогою C#.
Раніше ми надавали докладний посібник із вилучення тексту з файлів PPT за допомогою C#. Для більш ретельного вивчення, будь ласка, перегляньте наш повний посібник про те, як витягти текст з PPT за допомогою C#.