この簡単なハウツー記事では、C# で Word 文書から画像を抽出する 詳細な手順について説明します。画像を取得するための入力ファイルとして DOCX を使用します。ただし、C# 言語を使用して画像を抽出するための DOC 形式のドキュメントを提供することもできます。さらに、C# を使用して Word ファイルから画像を取得する方法を示す実際の例を作成します。
C# で Word 文書から画像を抽出する手順
- NuGet Web サイトから GroupDocs.Parser for .NET パッケージを .NET プロジェクトにインストールして、Word 文書から画像を抽出します
- Word ファイルから画像を抽出するために必要な名前空間の参照を追加します
- 入力 DOCX ドキュメントをロードするための Parser クラスをインスタンス化します
- Word 文書から画像を収集するために、Parser クラスの GetImages メソッドを呼び出します。
- 画像コレクションを反復処理し、画像のサイズ、タイプ、および内容を取得します
上記のポイントでは、C# を使用して Word 文書からすべての画像を抽出する機能を作成するためのすべての手順について説明しました。 NuGet パッケージ マネージャーから必要なパッケージを構成し、必要な名前空間をコードに含めた後、Parser クラスを初期化して、ソース Word ファイルを読み込む必要があります。その後、GetImages を使用して画像オブジェクトを収集し、コレクションを反復処理して画像データを表示できます。
C# で Word 文書から画像を抽出するコード
using System; | |
using System.Collections.Generic; | |
using System.Text; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractImagesFromWordDocumentInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract images from word using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.docx")) | |
{ | |
// Extract images | |
IEnumerable<PageImageArea> images = parser.GetImages(); | |
// Check if images extraction is supported | |
if (images == null) | |
{ | |
Console.WriteLine("Images extraction isn't supported"); | |
return; | |
} | |
// Iterate over images | |
foreach (PageImageArea image in images) | |
{ | |
// Print a page index, rectangle and image type: | |
Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", image.Page.Index, image.Rectangle, image.FileType)); | |
} | |
} | |
} | |
} | |
} |
上記のコード スニペットでは、Word アプリケーションからの C# イメージ エクストラクタが、この機能の動作を示すために開発されています。画像の抽出にサードパーティのツールは使用しません。このサンプルは、特定の要件に応じてさらに拡張できます。この例は、Windows、macOS、Linux などのオペレーティング システムでも使用できます。
この投稿では、C# で Word ドキュメントから画像を抽出するプロセスについて説明し、そのサンプル コードを開発しました。最近、C# で Word 文書からテキストを抽出するための記事を公開しました。詳細については、C# を使用して Word 文書からテキストを抽出する方法 ガイドをご覧ください。