C# で PDF をテキストに変換する方法

このチュートリアルでは、最高のドキュメント コンバーター ライブラリの 1 つを使用してドキュメント変換を実行する手順を順を追って説明し、C# で PDFText に変換する方法を学びます。このガイドで定義されているプロセスを使用して、PDF からテキストへのコンバーター C# 機能をすばやく実装できます。さらに、これらの手順は追加のサードパーティ ソフトウェアを必要とせず、MS Windows、Linux、Mac OS などの任意のオペレーティング システムに実装できます。

C# で PDF をテキストに変換する手順

  1. PDF to Text 機能を実装するために、.NET プロジェクトの NuGet から GroupDocs.Conversion for .NET パッケージをインストールします。
  2. GroupDocs.Conversion 名前空間への参照を追加して、PDF をテキストに変換します
  3. Converter クラスのオブジェクトを作成し、ソース PDF ファイルをそのコンストラクターに渡します
  4. WordProcessingConvertOptions クラスを初期化し、テキスト ドキュメントをカスタマイズするためのパラメータを定義します
  5. 最後に、Converter クラスの Convert メソッドを呼び出して、PDF をテキスト ドキュメントとして保存します。

これらのポイントでは、C# の PDF からテキストへの変換 機能を実装するためにライブラリを構成した後、PDF ファイルをロードするために Converter クラスが開始されます。次に、WordProcessingConvertOptions クラスを初期化して、出力テキスト ファイルをカスタマイズするためのプロパティを設定します。最後に、Convert メソッドを呼び出して、出力テキスト ドキュメントをディスクに保存します。

C# で PDF をテキストに変換するコード

Convert PDF to text C# 機能は、前のセクションで説明した手順を使用して、上記のスニペットで作成されます。ドキュメント変換ライブラリのいくつかの API 呼び出しを使用して、PDF をテキストに変更しました。 HTML、CSV、DOCX、DWF、EML、ODT、PNG など、さまざまなドキュメントをテキスト形式に変換することもできます。

私たちは、C# の PDF からテキストを取得する機能を実装するためのドキュメント変換プロセスに集中しました。最近、C# で HTML をテキストに変更する記事を公開しました。詳細については C# を使用して HTML をテキストに変換する方法 ガイドをご覧ください。

 日本語