Cet article fournit des instructions détaillées sur la façon d’extraire les métadonnées du document Word en C# avec quelques appels d’API simples. Vous pouvez également trouver un exemple de code fonctionnel pour obtenir des métadonnées Word à l’aide de C# dans cet article. Le flux de travail décrit dans ce guide ne dépend d’aucun autre outil tiers et peut être suivi sur n’importe lequel des systèmes d’exploitation populaires tels que Windows, macOS et Linux qui prennent en charge un environnement .NET.
Étapes pour extraire les métadonnées d’un document Word en C
- Configurez le package GroupDocs.Parser for .NET à partir du gestionnaire de packages NuGet dans le projet .NET pour extraire les métadonnées du document Word
- Ajouter une référence aux espaces de noms nécessaires pour extraire les métadonnées du fichier Word
- Instanciez la classe Parser pour charger le fichier DOCX d’entrée
- Appelez la méthode GetMetadata de la classe Parser pour obtenir la collection de métadonnées
- Enfin, parcourez la collection pour obtenir le nom et la valeur des métadonnées
Le flux de travail ci-dessus vous permet de créer rapidement la capacité d’obtenir un document Word de métadonnées en C#. Vous pouvez initialiser le processus d’extraction des métadonnées Word en configurant le package requis et en incluant l’espace de noms nécessaire dans le code. Une fois que vous avez terminé, vous devez charger le fichier DOC ou DOCX en initialisant la classe Parser. Dans les deux étapes suivantes, vous devez appeler la méthode GetMetadata pour obtenir la collecte de métadonnées, puis la parcourir pour un traitement ultérieur.
Code pour extraire les métadonnées d’un document Word en C
L’application C# metadata Word document est développée pour la démonstration en utilisant les instructions expliquées dans la section précédente. Nous avons écrit quelques lignes de code et consommé quelques appels d’API pour extraire les métadonnées d’un fichier Word. De plus, vous pouvez facilement extraire des métadonnées d’autres formats de documents tels que DOC, DOCX, RTF, XLSX, PDF, PPTX, MSG, EML et bien d’autres en modifiant légèrement cet exemple de code.
Nous avons discuté des instructions détaillées pour extraire les métadonnées d’un document Word à l’aide de C # et avons développé un exemple d’application pour cela. Récemment, nous avons publié un article sur l’extraction d’images de PowerPoint à l’aide de C#, consultez le guide comment extraire des images de PowerPoint en C # pour plus d’informations. Si vous souhaitez en savoir plus sur les produits GroupDocs, visitez ce page.