Cómo extraer metadatos de un documento de Word en C#

Este artículo proporciona instrucciones paso a paso sobre cómo extraer metadatos del documento Word en C# con unas pocas llamadas simples a la API. También puede encontrar un código de muestra funcional para obtener metadatos de Word usando C# en esta publicación. El flujo de trabajo descrito en esta guía no depende de ninguna otra herramienta de terceros y se puede seguir en cualquiera de los sistemas operativos populares como Windows, macOS y Linux que admiten un entorno .NET.

Pasos para extraer metadatos de un documento de Word en C#

  1. Configure el paquete GroupDocs.Parser for .NET del administrador de paquetes NuGet en el proyecto .NET para extraer metadatos del documento de Word
  2. Agregue una referencia a los espacios de nombres necesarios para extraer metadatos del archivo de Word
  3. Crea una instancia de la clase Parser para cargar el archivo DOCX de entrada
  4. Invoque el método GetMetadata de la clase Parser para obtener la colección de metadatos
  5. Finalmente, itere sobre la colección para obtener el nombre y el valor de los metadatos.

El flujo de trabajo anterior le permite crear rápidamente la capacidad de obtener un documento de Word de metadatos en C#. Puede inicializar el proceso de extracción de metadatos de Word configurando el paquete requerido e incluyendo el espacio de nombres necesario en el código. Una vez que haya terminado con esto, debe cargar el archivo DOC o DOCX inicializando la clase Parser. En los siguientes dos pasos, debe llamar al método GetMetadata para obtener la recopilación de metadatos y luego iterarlo para su posterior procesamiento.

Código para extraer metadatos de un documento de Word en C#

La aplicación Documento de Word de metadatos de C# está desarrollada para demostración usando las instrucciones explicadas en la sección anterior. Hemos escrito un código de algunas líneas y consumido algunas llamadas API para extraer metadatos de un archivo de Word. Además, puede extraer fácilmente metadatos de otros formatos de documentos como DOC, DOCX, RTF, XLSX, PDF, PPTX, MSG, EML y muchos más con un pequeño ajuste de este código de muestra.

Hemos discutido las instrucciones detalladas para extraer metadatos de un documento de Word usando C# y hemos desarrollado una aplicación de muestra para ello. Recientemente, publicamos un artículo para extraer imágenes de PowerPoint usando C#, consulte la guía cómo extraer imágenes de PowerPoint en C# para obtener más información. Si está interesado en obtener más información sobre los productos de GroupDocs, visite este page.

 Español