Як витягти текст із PowerPoint за допомогою C#

У цьому короткому посібнику надається поетапна інформація за допомогою одного з найкращих API вилучення документів для вилучення тексту з PowerPoint за допомогою C#. Для вилучення тексту з PPTX у програмі C# потрібно лише написати кілька рядків коду, який складається з простих викликів API. Тут ви можете переглянути основні кроки, а також зразок фрагмента коду для вилучення тексту з документів.

Кроки для вилучення тексту з PowerPoint за допомогою C#

  1. Установіть пакет GroupDocs.Parser for .NET із менеджера пакетів NuGet у програмі .NET, щоб отримати текст із PowerPoint
  2. Додайте посилання на необхідні простори імен для вилучення тексту з документа PowerPoint
  3. Створіть екземпляр класу Parser для завантаження вхідного документа PowerPoint
  4. Викличте метод GetText класу Parser для отримання об’єкта TextReader
  5. Прочитайте текст із TextReader і виведіть його на екран

Наведені вище інструкції дають змогу швидко розробити програму для вилучення тексту з PPT за допомогою C#. Вам просто потрібно послідовно виконати ці кроки, інсталювати необхідну бібліотеку, імпортувати необхідні класи та використати кілька викликів API для вилучення тексту з документів PowerPoint. Крім того, ці кроки можна виконувати в будь-якій операційній системі, як-от Windows, macOS і Linux, без налаштування сторонніх інструментів.

Код для вилучення тексту з PowerPoint за допомогою C#

using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Data;
namespace ExtractTextFromPowerpointUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to extract text from Powerpoint using C#
{
// Remove the watermark in output
string licensePath = "GroupDocs.Parser.lic";
GroupDocs.Parser.License lic = new GroupDocs.Parser.License();
lic.SetLicense(licensePath);
// Create an instance of Parser class
using (Parser parser = new Parser("sample.pptx"))
{
// Extract a text into the reader
using(TextReader reader = parser.GetText())
{
// Print a text from the document
// If text extraction isn't supported, a reader is null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
}
}
}

Наведений вище фрагмент коду демонструє, як створити функціональність для файлу C# отримати текст із PowerPoint за допомогою поетапного робочого процесу, описаного в попередньому розділі. Ми розпочали процес вилучення тексту, налаштувавши необхідний пакет із веб-сайту NuGet, а потім включивши в код основні простори імен. Після цього ми створили екземпляр класу Parser для завантаження файлу PowerPoint для отримання з нього тексту. На останніх двох кроках ми зібрали об’єкт TextReader, викликавши метод GetText, а потім прочитали текст із пристрою для читання для подальшої обробки.

Ми обговорили детальні інструкції щодо видобування тексту з PowerPoint на C# та розробили приклад програми для цього. Нещодавно ми опублікували статтю про вилучення тексту з HTML за допомогою C#, перегляньте посібник як витягти текст із HTML у C# для отримання додаткової інформації.

 Українська