В этой короткой статье подробно объясняется каждый шаг извлечения текста из XML на C# и рассказывается, как использовать эти пошаговые инструкции для разработки приложения для получения текста из XML с помощью C#. В этом посте также рассказывается, как настроить среду для извлечения текста из документов. Ниже вы можете ознакомиться с основными шагами вместе с рабочим примером чтения текста из XML с помощью C#.
Шаги по извлечению текста из XML в C#
- Установите пакет GroupDocs.Parser for .NET из диспетчера пакетов NuGet в проекте .NET, чтобы извлечь текст из XML-файла.
- Добавьте ссылку на необходимые пространства имен для извлечения текста из XML-файла.
- Создайте экземпляр класса Parser для загрузки входного XML-документа.
- Вызвать метод GetText класса Parser для получения объекта TextReader.
- Наконец, прочитайте текст из TextReader и отобразите его на экране.
В предыдущем разделе мы объяснили рабочий процесс для создания функции C# получения текста из XML*. Прежде всего, вы должны установить необходимый пакет и импортировать необходимые пространства имен для извлечения текста из документа. На следующих шагах следует инициировать класс Parser для загрузки входного XML-файла, использовать его метод GetText для получения объекта TextReader, а затем прочитать текст из средства чтения.
Код для извлечения текста из XML в C#
using System; | |
using System.Collections.Generic; | |
using System.Text; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractTextFromXmlInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract Text from XML using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.xml")) | |
{ | |
// Extract a text into the reader | |
using(TextReader reader = parser.GetText()) | |
{ | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd()); | |
} | |
} | |
} | |
} | |
} |
Приведенный выше фрагмент кода демонстрирует, как разработать извлечение текста из XML с помощью приложения C#. Пример кода показывает, что функциональность создается с помощью нескольких строк кода, состоящего из простых вызовов API. Более того, вы можете использовать этот код в любой из распространенных операционных систем, таких как Windows, Linux и macOS, которые поддерживают среду .NET, даже без установки каких-либо других сторонних инструментов.
Мы обсудили подробные инструкции по получению текста из XML на C# и разработали для него пример приложения. Недавно мы опубликовали статью об извлечении текста из PowerPoint на C#. Дополнительные сведения см. в руководстве как извлечь текст из PowerPoint с помощью C#.