Como extrair metadados do documento do Word em C #

Este artigo fornece instruções passo a passo sobre como extrair metadados do documento Word em C# com algumas chamadas de API simples. Você também pode encontrar um exemplo de código funcional para obter metadados do Word usando C# nesta postagem. O fluxo de trabalho descrito neste guia não depende de nenhuma outra ferramenta de terceiros e pode ser seguido em qualquer um dos sistemas operacionais populares como Windows, macOS e Linux que oferecem suporte a um ambiente .NET.

Etapas para extrair metadados do documento do Word em C

  1. Configure o pacote GroupDocs.Parser for .NET do gerenciador de pacotes NuGet no projeto .NET para extrair metadados do documento do Word
  2. Adicione uma referência aos namespaces necessários para extrair metadados do arquivo do Word
  3. Instancie a classe Parser para carregar o arquivo DOCX de entrada
  4. Invoque o método GetMetadata da classe Parser para obter a coleção de metadados
  5. Por fim, repita a coleção para obter o nome e o valor dos metadados

O fluxo de trabalho acima permite criar rapidamente a capacidade de obter metadados do documento do Word em C#. Você pode inicializar o processo de extração de metadados do Word configurando o pacote necessário e incluindo o namespace necessário no código. Uma vez feito isso, você precisa carregar o arquivo DOC ou DOCX inicializando a classe Parser. Nas próximas duas etapas, você deve chamar o método GetMetadata para obter a coleta de metadados e, em seguida, iterá-lo para processamento adicional.

Código para extrair metadados do documento do Word em C

O aplicativo C# metadata Word document é desenvolvido para demonstração usando as instruções explicadas na seção anterior. Escrevemos algumas linhas de código e consumimos algumas chamadas de API para extrair metadados de um arquivo do Word. Além disso, você pode facilmente extrair metadados de outros formatos de documento, como DOC, DOCX, RTF, XLSX, PDF, PPTX, MSG, EML e muitos outros, com alguns ajustes neste código de amostra.

Discutimos as instruções detalhadas para extrair metadados do documento do Word usando C# e desenvolvemos um aplicativo de exemplo para ele. Recentemente, publicamos um artigo para extrair imagens do PowerPoint usando C#, dê uma olhada no guia como extrair imagens do PowerPoint em C # para mais informações. Se você estiver interessado em saber mais sobre os produtos GroupDocs, visite este page.

 Português