Как да извлечете текст от PowerPoint с помощта на C#

Този бърз урок предоставя поетапна информация с помощта на един от най-добрите API за извличане на документи за извличане на текст от PowerPoint с помощта на C#. Приложението извличане на текст от PPTX в C# изисква само да напишете няколко реда код, който се състои от прости извиквания на API. Тук можете да разгледате основните стъпки, както и примерен кодов фрагмент за извличане на текст от документи.

Стъпки за извличане на текст от PowerPoint с помощта на C#

  1. Инсталирайте пакета GroupDocs.Parser for .NET от мениджъра на пакети NuGet в приложението .NET, за да извлечете текст от PowerPoint
  2. Добавете препратка към необходимите пространства от имена за извличане на текст от документа на PowerPoint
  3. Създайте екземпляр на класа Parser за зареждане на входния документ на PowerPoint
  4. Извикайте метода GetText на класа Parser за получаване на обекта TextReader
  5. Прочетете текста от TextReader и го покажете на екрана

Горните инструкции ви позволяват бързо да разработите приложението за извличане на текст от PPT с помощта на C#. Просто трябва да следвате тези стъпки в последователност, да инсталирате необходимата библиотека, да импортирате необходимите класове и да използвате няколко извиквания на API за извличане на текста от документи на PowerPoint. Освен това, тези стъпки могат да бъдат изпълнени на всяка операционна система като Windows, macOS и Linux, без да се настройва инструмент на трета страна.

Код за извличане на текст от PowerPoint с помощта на C#

using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Data;
namespace ExtractTextFromPowerpointUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to extract text from Powerpoint using C#
{
// Remove the watermark in output
string licensePath = "GroupDocs.Parser.lic";
GroupDocs.Parser.License lic = new GroupDocs.Parser.License();
lic.SetLicense(licensePath);
// Create an instance of Parser class
using (Parser parser = new Parser("sample.pptx"))
{
// Extract a text into the reader
using(TextReader reader = parser.GetText())
{
// Print a text from the document
// If text extraction isn't supported, a reader is null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
}
}
}

Горният кодов фрагмент демонстрира как да създадете функционалността за файла C# get Text from PowerPoint с помощта на поетапния работен процес, описан в предишния раздел. Започнахме процеса на извличане на текст, като конфигурирахме необходимия пакет от уебсайта на NuGet и след това включихме основните пространства от имена в кода. След това създадохме екземпляра на класа Parser за зареждане на файла на PowerPoint за получаване на текст от него. В последните две стъпки събрахме обекта TextReader чрез извикване на метода GetText и след това прочетохме текста от четеца за по-нататъшна обработка.

Обсъдихме подробните инструкции за извличане на текст от PowerPoint в C# и разработихме примерно приложение за него. Наскоро публикувахме статия за извличане на текст от HTML с помощта на C#, вижте ръководството как да извлечете текст от HTML в C# за повече информация.

 Български