Този бърз урок предоставя поетапна информация с помощта на един от най-добрите API за извличане на документи за извличане на текст от PowerPoint с помощта на C#. Приложението извличане на текст от PPTX в C# изисква само да напишете няколко реда код, който се състои от прости извиквания на API. Тук можете да разгледате основните стъпки, както и примерен кодов фрагмент за извличане на текст от документи.
Стъпки за извличане на текст от PowerPoint с помощта на C#
- Инсталирайте пакета GroupDocs.Parser for .NET от мениджъра на пакети NuGet в приложението .NET, за да извлечете текст от PowerPoint
- Добавете препратка към необходимите пространства от имена за извличане на текст от документа на PowerPoint
- Създайте екземпляр на класа Parser за зареждане на входния документ на PowerPoint
- Извикайте метода GetText на класа Parser за получаване на обекта TextReader
- Прочетете текста от TextReader и го покажете на екрана
Горните инструкции ви позволяват бързо да разработите приложението за извличане на текст от PPT с помощта на C#. Просто трябва да следвате тези стъпки в последователност, да инсталирате необходимата библиотека, да импортирате необходимите класове и да използвате няколко извиквания на API за извличане на текста от документи на PowerPoint. Освен това, тези стъпки могат да бъдат изпълнени на всяка операционна система като Windows, macOS и Linux, без да се настройва инструмент на трета страна.
Код за извличане на текст от PowerPoint с помощта на C#
using System; | |
using System.Collections.Generic; | |
using System.Text; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractTextFromPowerpointUsingCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract text from Powerpoint using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.pptx")) | |
{ | |
// Extract a text into the reader | |
using(TextReader reader = parser.GetText()) | |
{ | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd()); | |
} | |
} | |
} | |
} | |
} |
Горният кодов фрагмент демонстрира как да създадете функционалността за файла C# get Text from PowerPoint с помощта на поетапния работен процес, описан в предишния раздел. Започнахме процеса на извличане на текст, като конфигурирахме необходимия пакет от уебсайта на NuGet и след това включихме основните пространства от имена в кода. След това създадохме екземпляра на класа Parser за зареждане на файла на PowerPoint за получаване на текст от него. В последните две стъпки събрахме обекта TextReader чрез извикване на метода GetText и след това прочетохме текста от четеца за по-нататъшна обработка.
Обсъдихме подробните инструкции за извличане на текст от PowerPoint в C# и разработихме примерно приложение за него. Наскоро публикувахме статия за извличане на текст от HTML с помощта на C#, вижте ръководството как да извлечете текст от HTML в C# за повече информация.