Jak extrahovat metadata z dokumentu Word v C#

Tento článek poskytuje postupné pokyny, jak extrahovat metadata z dokumentu Word v C# pomocí několika jednoduchých volání API. V tomto příspěvku můžete také najít funkční ukázkový kód pro získání metadat aplikace Word pomocí C#. Pracovní postup popsaný v této příručce nezávisí na žádném jiném nástroji třetí strany a lze jej sledovat na libovolném z oblíbených operačních systémů, jako jsou Windows, macOS a Linux, které podporují prostředí .NET.

Kroky k extrahování metadat z dokumentu Word v C#

  1. Nastavte balíček GroupDocs.Parser for .NET ze správce balíčků NuGet v projektu .NET pro extrahování metadat z dokumentu Word
  2. Přidejte odkaz na potřebné jmenné prostory pro extrahování metadat ze souboru aplikace Word
  3. Vytvořte instanci třídy Parser pro načtení vstupního souboru DOCX
  4. Pro získání kolekce metadat vyvolejte metodu GetMetadata třídy Parser
  5. Nakonec iterujte kolekci, abyste získali název a hodnotu metadat

Výše uvedený pracovní postup vám umožňuje rychle vytvořit schopnost získávat metadata dokumentu Word v C#. Proces extrakce metadat aplikace Word můžete inicializovat nastavením požadovaného balíčku a zahrnutím potřebného jmenného prostoru do kódu. Jakmile s tím budete hotovi, musíte načíst soubor DOC nebo DOCX inicializací třídy Parser. V dalších dvou krocích musíte zavolat metodu GetMetadata pro získání sběru metadat a poté ji iterovat pro další zpracování.

Kód pro extrahování metadat z dokumentu Word v C#

Aplikace Word document C# metadata je vyvinuta pro předvedení pomocí pokynů vysvětlených v předchozí části. Napsali jsme několik řádků kódu a spotřebovali několik volání API pro extrahování metadat ze souboru aplikace Word. Dále můžete snadno extrahovat metadata z jiných formátů dokumentů, jako jsou DOC, DOCX, RTF, XLSX, PDF, PPTX, MSG, EML a mnoha dalších s malým vylepšením tohoto ukázkového kódu.

Diskutovali jsme o podrobných pokynech k extrahování metadat z dokumentu Word pomocí C# a vyvinuli jsme pro ně vzorovou aplikaci. Nedávno jsme publikovali článek o extrahování obrázků z PowerPointu pomocí C#, další informace naleznete v průvodci jak extrahovat obrázky z PowerPointu v C#. Pokud se chcete dozvědět více o produktech GroupDocs, navštivte tento page.

 Čeština