En este breve artículo de procedimientos, analizaremos el procedimiento detallado para extraer imágenes de un documento de Word en C#. Usaremos DOCX como archivo de entrada para obtener imágenes. Sin embargo, también puede proporcionar un documento en formato DOC para extraer imágenes utilizando el lenguaje C#. Además, crearemos un ejemplo de trabajo para mostrarle cómo obtener imágenes de un archivo de Word usando C#.
Pasos para extraer imágenes de un documento de Word en C#
- Instale el paquete GroupDocs.Parser for .NET desde el sitio web de NuGet en el proyecto .NET para extraer imágenes del documento de Word
- Agregue una referencia de los espacios de nombres necesarios para extraer las imágenes del archivo de Word
- Crea una instancia de la clase Parser para cargar el documento DOCX de entrada
- Llame al método GetImages de la clase Parser para recopilar imágenes del documento de Word
- Repita la colección de imágenes y obtenga el tamaño, el tipo y el contenido de las imágenes.
En los puntos anteriores, hemos explicado cada paso para crear la funcionalidad para extraer todas las imágenes de un documento de Word usando C#. Deberá cargar el archivo de origen de Word inicializando la clase Parser después de configurar el paquete requerido desde el administrador de paquetes NuGet e incluir los espacios de nombres requeridos en el código. Después de eso, GetImages le permite recopilar objetos de imágenes y luego puede iterar sobre la colección para mostrar los datos de la imagen.
Código para extraer imágenes de un documento de Word en C#
using System; | |
using System.Collections.Generic; | |
using System.Text; | |
using System.IO; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractImagesFromWordDocumentInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract images from word using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.docx")) | |
{ | |
// Extract images | |
IEnumerable<PageImageArea> images = parser.GetImages(); | |
// Check if images extraction is supported | |
if (images == null) | |
{ | |
Console.WriteLine("Images extraction isn't supported"); | |
return; | |
} | |
// Iterate over images | |
foreach (PageImageArea image in images) | |
{ | |
// Print a page index, rectangle and image type: | |
Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", image.Page.Index, image.Rectangle, image.FileType)); | |
} | |
} | |
} | |
} | |
} |
En el fragmento de código anterior, se desarrolla la aplicación C# Image extractor from Word para demostrar el funcionamiento de esta función. No utilizamos ninguna herramienta de terceros para extraer imágenes. Este ejemplo se puede mejorar aún más según sus requisitos específicos y también puede usar este ejemplo en cualquier sistema operativo como Windows, macOS y Linux.
Hemos discutido el proceso para extraer imágenes de documentos de Word en C# y hemos desarrollado un código de muestra en esta publicación. Recientemente, publicamos un artículo para extraer texto de un documento de Word en C#. Consulte la guía cómo extraer texto de un documento de Word usando C# para obtener más información.