このクイック チュートリアルでは、C# を使用して PowerPoint からテキストを抽出する最高のドキュメント抽出 API の 1 つを使用して段階的な情報を提供します。 C# の PPTX からテキストを抽出する アプリケーションでは、単純な API 呼び出しで構成される数行のコードを記述するだけで済みます。ここでは、主な手順と、ドキュメントからテキストを抽出するためのサンプル コード スニペットを確認できます。
C# を使用して PowerPoint からテキストを抽出する手順
- .NET アプリケーションの NuGet パッケージ マネージャーから GroupDocs.Parser for .NET パッケージをインストールして、PowerPoint からテキストを抽出します
- PowerPoint ドキュメントからテキストを抽出するために必要な名前空間への参照を追加します
- 入力 PowerPoint ドキュメントを読み込むための Parser クラスをインスタンス化します
- TextReader オブジェクトを取得するには、Parser クラスの GetText メソッドを呼び出します。
- TextReader からテキストを読み取り、画面に表示する
上記の手順により、C# を使用して PPT からテキストを抽出するアプリケーションをすばやく開発できます。これらの手順を順番に実行し、必要なライブラリをインストールし、必要なクラスをインポートし、いくつかの API 呼び出しを使用して PowerPoint ドキュメントからテキストを抽出するだけです。さらに、これらの手順は、サードパーティのツールをセットアップすることなく、Windows、macOS、Linux などの任意のオペレーティング システムで実行できます。
C# を使用して PowerPoint からテキストを抽出するコード
using System; | |
using System.Collections.Generic; | |
using System.Text; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractTextFromPowerpointUsingCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract text from Powerpoint using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.pptx")) | |
{ | |
// Extract a text into the reader | |
using(TextReader reader = parser.GetText()) | |
{ | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd()); | |
} | |
} | |
} | |
} | |
} |
上記のコード スニペットは、前のセクションで説明した段階的なワークフローを使用して、C# get Text from PowerPoint ファイルの機能を作成する方法を示しています。 NuGet Web サイトから必要なパッケージを構成し、コードに重要な名前空間を含めることで、テキスト抽出プロセスを開始しました。その後、テキストを取得するために PowerPoint ファイルを読み込むための Parser クラス インスタンスを作成しました。最後の 2 つの手順では、GetText メソッドを呼び出して TextReader オブジェクトを収集し、さらに処理するためにリーダーからテキストを読み取りました。
C# で PowerPoint からテキストを抽出する詳細な手順について説明し、そのためのサンプル アプリケーションを開発しました。最近、C# を使用して HTML からテキストを抽出するための記事を公開しました。詳細については、C# で HTML からテキストを抽出する方法 ガイドをご覧ください。