この記事では、いくつかの単純な API 呼び出しを使用して、C# で Word ドキュメントからメタデータを抽出する方法について段階的な手順を説明します。この投稿では、C# を使用して Word メタデータを取得するための実用的なサンプル コードも見つけることができます。このガイドで説明するワークフローは、他のサードパーティ製ツールに依存せず、.NET 環境をサポートする Windows、macOS、Linux などの一般的なオペレーティング システムのいずれでも従うことができます。
C# で Word 文書からメタデータを抽出する手順
- .NET プロジェクトの NuGet パッケージ マネージャーから GroupDocs.Parser for .NET パッケージをセットアップして、Word ドキュメントからメタデータを抽出します
- Word ファイルからメタデータを抽出するために必要な名前空間への参照を追加します。
- 入力 DOCX ファイルをロードするための Parser クラスをインスタンス化します
- メタデータ コレクションを取得するために、Parser クラスの GetMetadata メソッドを呼び出します。
- 最後に、コレクションを繰り返し処理して、メタデータの名前と値を取得します
上記のワークフローにより、C# でメタデータ Word ドキュメントを取得する機能を迅速に作成できます。必要なパッケージを設定し、必要な名前空間をコードに含めることで、Word メタデータ抽出プロセスを初期化できます。これが完了したら、Parser クラスを初期化して DOC または DOCX ファイルをロードする必要があります。次の 2 つの手順では、GetMetadata メソッドを呼び出してメタデータ コレクションを取得し、それを繰り返してさらに処理する必要があります。
C# で Word ドキュメントからメタデータを抽出するコード
C# メタデータ Word ドキュメント アプリケーションは、前のセクションで説明した手順を使用してデモンストレーション用に開発されています。 Word ファイルからメタデータを抽出するために、数行のコードを記述し、いくつかの API 呼び出しを使用しました。さらに、このサンプル コードを微調整するだけで、DOC、DOCX、RTF、XLSX、PDF、PPTX、MSG、EML などの他のドキュメント形式からメタデータを簡単に抽出できます。
C# を使用して Word 文書からメタデータを抽出する詳細な手順について説明し、そのためのサンプル アプリケーションを開発しました。最近、C# を使用して PowerPoint から画像を抽出するための記事を公開しました。詳細については、C# で PowerPoint から画像を抽出する方法 ガイドをご覧ください。 GroupDocs 製品について詳しく知りたい場合は、この page にアクセスしてください。