C# で Word 文書からメタデータを抽出する方法

この記事では、いくつかの単純な API 呼び出しを使用して、C# で Word ドキュメントからメタデータを抽出する方法について段階的な手順を説明します。この投稿では、C# を使用して Word メタデータを取得するための実用的なサンプル コードも見つけることができます。このガイドで説明するワークフローは、他のサードパーティ製ツールに依存せず、.NET 環境をサポートする Windows、macOS、Linux などの一般的なオペレーティング システムのいずれでも従うことができます。

C# で Word 文書からメタデータを抽出する手順

  1. .NET プロジェクトの NuGet パッケージ マネージャーから GroupDocs.Parser for .NET パッケージをセットアップして、Word ドキュメントからメタデータを抽出します
  2. Word ファイルからメタデータを抽出するために必要な名前空間への参照を追加します。
  3. 入力 DOCX ファイルをロードするための Parser クラスをインスタンス化します
  4. メタデータ コレクションを取得するために、Parser クラスの GetMetadata メソッドを呼び出します。
  5. 最後に、コレクションを繰り返し処理して、メタデータの名前と値を取得します

上記のワークフローにより、C# でメタデータ Word ドキュメントを取得する機能を迅速に作成できます。必要なパッケージを設定し、必要な名前空間をコードに含めることで、Word メタデータ抽出プロセスを初期化できます。これが完了したら、Parser クラスを初期化して DOC または DOCX ファイルをロードする必要があります。次の 2 つの手順では、GetMetadata メソッドを呼び出してメタデータ コレクションを取得し、それを繰り返してさらに処理する必要があります。

C# で Word ドキュメントからメタデータを抽出するコード

C# メタデータ Word ドキュメント アプリケーションは、前のセクションで説明した手順を使用してデモンストレーション用に開発されています。 Word ファイルからメタデータを抽出するために、数行のコードを記述し、いくつかの API 呼び出しを使用しました。さらに、このサンプル コードを微調整するだけで、DOC、DOCX、RTF、XLSX、PDF、PPTX、MSG、EML などの他のドキュメント形式からメタデータを簡単に抽出できます。

C# を使用して Word 文書からメタデータを抽出する詳細な手順について説明し、そのためのサンプル アプリケーションを開発しました。最近、C# を使用して PowerPoint から画像を抽出するための記事を公開しました。詳細については、C# で PowerPoint から画像を抽出する方法 ガイドをご覧ください。 GroupDocs 製品について詳しく知りたい場合は、この page にアクセスしてください。

 日本語