У цьому короткому посібнику надається поетапна інформація за допомогою одного з найкращих API вилучення документів для вилучення тексту з PowerPoint за допомогою C#. Для вилучення тексту з PPTX у програмі C# потрібно лише написати кілька рядків коду, який складається з простих викликів API. Тут ви можете переглянути основні кроки, а також зразок фрагмента коду для вилучення тексту з документів.
Кроки для вилучення тексту з PowerPoint за допомогою C#
- Установіть пакет GroupDocs.Parser for .NET із менеджера пакетів NuGet у програмі .NET, щоб отримати текст із PowerPoint
- Додайте посилання на необхідні простори імен для вилучення тексту з документа PowerPoint
- Створіть екземпляр класу Parser для завантаження вхідного документа PowerPoint
- Викличте метод GetText класу Parser для отримання об’єкта TextReader
- Прочитайте текст із TextReader і виведіть його на екран
Наведені вище інструкції дають змогу швидко розробити програму для вилучення тексту з PPT за допомогою C#. Вам просто потрібно послідовно виконати ці кроки, інсталювати необхідну бібліотеку, імпортувати необхідні класи та використати кілька викликів API для вилучення тексту з документів PowerPoint. Крім того, ці кроки можна виконувати в будь-якій операційній системі, як-от Windows, macOS і Linux, без налаштування сторонніх інструментів.
Код для вилучення тексту з PowerPoint за допомогою C#
using System; | |
using System.Collections.Generic; | |
using System.Text; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractTextFromPowerpointUsingCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract text from Powerpoint using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.pptx")) | |
{ | |
// Extract a text into the reader | |
using(TextReader reader = parser.GetText()) | |
{ | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd()); | |
} | |
} | |
} | |
} | |
} |
Наведений вище фрагмент коду демонструє, як створити функціональність для файлу C# отримати текст із PowerPoint за допомогою поетапного робочого процесу, описаного в попередньому розділі. Ми розпочали процес вилучення тексту, налаштувавши необхідний пакет із веб-сайту NuGet, а потім включивши в код основні простори імен. Після цього ми створили екземпляр класу Parser для завантаження файлу PowerPoint для отримання з нього тексту. На останніх двох кроках ми зібрали об’єкт TextReader, викликавши метод GetText, а потім прочитали текст із пристрою для читання для подальшої обробки.
Ми обговорили детальні інструкції щодо видобування тексту з PowerPoint на C# та розробили приклад програми для цього. Нещодавно ми опублікували статтю про вилучення тексту з HTML за допомогою C#, перегляньте посібник як витягти текст із HTML у C# для отримання додаткової інформації.