Jak wyodrębnić tekst z programu PowerPoint przy użyciu języka C#

Ten szybki samouczek zawiera informacje krok po kroku za pomocą jednego z najlepszych interfejsów API do wyodrębniania dokumentów w celu wyodrębniania tekstu z programu PowerPoint przy użyciu języka C#. Wyciąg tekstu z PPTX w aplikacji C# wymaga jedynie napisania kilku linijek kodu, które składają się z prostych wywołań API. Tutaj możesz zapoznać się z głównymi krokami, a także przykładowym fragmentem kodu do wyodrębniania tekstu z dokumentów.

Kroki, aby wyodrębnić tekst z programu PowerPoint przy użyciu języka C#

  1. Zainstaluj pakiet GroupDocs.Parser for .NET z menedżera pakietów NuGet w aplikacji .NET, aby wyodrębnić tekst z programu PowerPoint
  2. Dodaj odwołanie do przestrzeni nazw niezbędnych do wyodrębnienia tekstu z dokumentu programu PowerPoint
  3. Utwórz instancję klasy Parser do ładowania wejściowego dokumentu programu PowerPoint
  4. Wywołaj metodę GetText klasy Parser w celu uzyskania obiektu TextReader
  5. Przeczytaj tekst z TextReadera i wyświetl go na ekranie

Powyższe instrukcje pozwalają szybko opracować aplikację do wyodrębniania tekstu z PPT przy użyciu C#. Wystarczy wykonać kolejno te kroki, zainstalować wymaganą bibliotekę, zaimportować niezbędne klasy i wykorzystać kilka wywołań API w celu wyodrębnienia tekstu z dokumentów programu PowerPoint. Co więcej, te kroki można wykonać w dowolnym systemie operacyjnym, takim jak Windows, macOS i Linux, bez konfigurowania narzędzia innej firmy.

Kod do wyodrębniania tekstu z programu PowerPoint przy użyciu języka C#

Powyższy fragment kodu ilustruje sposób tworzenia funkcji dla pliku C# Pobierz tekst z programu PowerPoint przy użyciu krokowego przepływu pracy opisanego w poprzedniej sekcji. Rozpoczęliśmy proces wyodrębniania tekstu od skonfigurowania wymaganego pakietu ze strony internetowej NuGet, a następnie uwzględnienia niezbędnych przestrzeni nazw w kodzie. Następnie utworzyliśmy instancję klasy Parser do ładowania pliku PowerPoint w celu pobrania z niego tekstu. W ostatnich dwóch krokach zebraliśmy obiekt TextReader wywołując metodę GetText, a następnie odczytaliśmy tekst z czytnika do dalszego przetwarzania.

Omówiliśmy szczegółowe instrukcje wyodrębniania tekstu z programu PowerPoint w języku C# i opracowaliśmy dla niego przykładową aplikację. Niedawno opublikowaliśmy artykuł na temat wydobywania tekstu z HTML przy użyciu C#, zajrzyj do przewodnika jak wyodrębnić tekst z HTML w C#, aby uzyskać więcej informacji.

 Polski