Ovaj članak pruža postupne upute o tome kako izdvojiti metapodatke iz Word dokumenta u C# s nekoliko jednostavnih API poziva. U ovom postu također možete pronaći radni primjer koda za dohvaćanje Word metapodataka pomoću C#. Tijek rada opisan u ovom vodiču ne ovisi ni o jednom drugom alatu treće strane i može se pratiti na bilo kojem od popularnih operativnih sustava kao što su Windows, macOS i Linux koji podržavaju .NET okruženje.
Koraci za izdvajanje metapodataka iz Word dokumenta u C#
- Postavite GroupDocs.Parser for .NET paket iz NuGet upravitelja paketa u .NET projektu za izvlačenje metapodataka iz Word dokumenta
- Dodajte referencu na potrebne prostore imena za izdvajanje metapodataka iz Word datoteke
- Instancirajte klasu Parser za učitavanje ulazne DOCX datoteke
- Pozovite metodu GetMetadata klase Parser za dobivanje zbirke metapodataka
- Na kraju, iterirajte zbirku da biste dobili naziv i vrijednost metapodataka
Gornji tijek rada omogućuje vam brzo stvaranje mogućnosti za dobivanje metapodataka Word dokumenta u C#. Proces ekstrakcije metapodataka programa Word možete pokrenuti postavljanjem potrebnog paketa i uključivanjem potrebnog prostora imena u kod. Nakon što završite s ovim, trebate učitati DOC ili DOCX datoteku inicijaliziranjem klase Parser. U sljedeća dva koraka morate pozvati metodu GetMetadata za dobivanje zbirke metapodataka i zatim je ponoviti za daljnju obradu.
Kod za izdvajanje metapodataka iz Word dokumenta u C#
using System; | |
using System.Collections.Generic; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractMetadataFromWordDocumentInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract Metadata from Word using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.docx")) | |
{ | |
// Extract metadata from the document | |
IEnumerable<MetadataItem> metadata = parser.GetMetadata(); | |
// Check if metadata extraction is supported | |
if (metadata == null) | |
{ | |
Console.WriteLine("Metatada extraction isn't supported"); | |
} | |
// Iterate over metadata items | |
foreach (MetadataItem item in metadata) | |
{ | |
// Print an item name and value | |
Console.WriteLine(string.Format("{0}: {1}", item.Name, item.Value)); | |
} | |
} | |
} | |
} | |
} |
C# metapodaci Word dokumenta aplikacija razvijena je za demonstraciju pomoću uputa objašnjenih u prethodnom odjeljku. Napisali smo nekoliko redaka koda i iskoristili nekoliko API poziva za izdvajanje metapodataka iz Word datoteke. Nadalje, možete lako izdvojiti metapodatke iz drugih formata dokumenata kao što su DOC, DOCX, RTF, XLSX, PDF, PPTX, MSG, EML i mnogi drugi uz malo dotjerivanja ovog oglednog koda.
Razgovarali smo o detaljnim uputama za izdvajanje metapodataka iz Word dokumenta pomoću C# i razvili primjer aplikacije za to. Nedavno smo objavili članak o izdvajanju slika iz PowerPointa pomoću C#, pogledajte kako izvući slike iz PowerPointa u C# vodič za više informacija. Ako ste zainteresirani saznati više o GroupDocs proizvodima, posjetite ovu page.