Ovaj kratki vodič pruža postupne informacije pomoću jednog od najboljih API-ja za ekstrakciju dokumenata za ekstrahiranje teksta iz PowerPointa pomoću C#. Izdvajanje teksta iz PPTX u C# aplikaciji zahtijeva samo da napišete nekoliko redaka koda koji se sastoji od jednostavnih API poziva. Ovdje možete pogledati glavne korake kao i primjer isječka koda za izdvajanje teksta iz dokumenata.
Koraci za izdvajanje teksta iz PowerPointa pomoću C#
- Instalirajte paket GroupDocs.Parser for .NET iz upravitelja paketa NuGet u .NET aplikaciji da izvučete tekst iz PowerPointa
- Dodajte referencu na potrebne prostore imena za izdvajanje teksta iz PowerPoint dokumenta
- Instancirajte klasu Parser za učitavanje ulaznog PowerPoint dokumenta
- Pozovite metodu GetText klase Parser za dobivanje objekta TextReader
- Pročitajte tekst iz TextReader-a i prikažite ga na ekranu
Gore navedene upute omogućuju vam da brzo razvijete aplikaciju za izdvajanje teksta iz PPT-a pomoću C#. Samo trebate slijediti ove korake u nizu, instalirati potrebnu biblioteku, uvesti potrebne klase i potrošiti nekoliko API poziva za izdvajanje teksta iz PowerPoint dokumenata. Štoviše, ovi se koraci mogu izvesti na bilo kojem operativnom sustavu kao što su Windows, macOS i Linux bez postavljanja alata treće strane.
Kod za izdvajanje teksta iz PowerPointa pomoću C#
using System; | |
using System.Collections.Generic; | |
using System.Text; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractTextFromPowerpointUsingCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract text from Powerpoint using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.pptx")) | |
{ | |
// Extract a text into the reader | |
using(TextReader reader = parser.GetText()) | |
{ | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd()); | |
} | |
} | |
} | |
} | |
} |
Gornji isječak koda pokazuje kako stvoriti funkcionalnost za datoteku C# get Text from PowerPoint pomoću postupnog tijeka rada opisanog u prethodnom odjeljku. Započeli smo proces izdvajanja teksta konfiguriranjem potrebnog paketa s web-mjesta NuGet, a zatim uključivanjem osnovnih imenskih prostora u kod. Nakon toga, stvorili smo instancu klase Parser za učitavanje PowerPoint datoteke za dobivanje teksta iz nje. U posljednja dva koraka prikupili smo objekt TextReader pozivanjem metode GetText i potom pročitali tekst iz čitača za daljnju obradu.
Razgovarali smo o detaljnim uputama za izdvajanje teksta iz PowerPointa u C# i razvili oglednu aplikaciju za to. Nedavno smo objavili članak o izdvajanju teksta iz HTML-a pomoću C#, pogledajte kako izdvojiti tekst iz HTML-a u C# vodič za više informacija.