Kaip išgauti metaduomenis iš PDF naudojant C#

Šioje mokymo programoje aprašome nuoseklią procedūrą, kaip ištraukti metaduomenis iš PDF naudojant C# naudojant .NET API dokumento duomenims išgauti. Šiame vadove taip pat pateikiamos instrukcijos, kaip sukonfigūruoti reikiamą biblioteką ir pavyzdinį kodą, kad gautumėte metaduomenis iš PDF formatu C#. Čia pateikiami pagrindiniai metaduomenų iš dokumentų ištraukimo veiksmai ir darbo kodas.

Veiksmai metaduomenų ištraukimui iš PDF naudojant C#

  1. Nustatykite paketą GroupDocs.Parser for .NET iš NuGet paketų tvarkyklės .NET programoje, kad iš PDF ištrauktumėte metaduomenis
  2. Pridėkite nuorodą į pagrindines vardų sritis metaduomenų ištraukimui iš PDF dokumento
  3. Sukurkite klasės Parser egzempliorių ir įkelkite įvesties PDF dokumentą
  4. Iškvieskite metodą GetMetadata ir gaukite dokumentų metaduomenų objektų rinkinį
  5. Galiausiai peržiūrėkite kolekciją ir gaukite metaduomenų pavadinimus bei reikšmes

Norėdami įdiegti skaityti PDF metaduomenis C#, tiesiog atlikite aukščiau nurodytus veiksmus eilės tvarka. Pirmiausia įkelkite šaltinio PDF, inicijuodami Parser klasę, įdiegę reikiamą paketą iš NuGet ir importuodami esmines vardų sritis. Po to metodas GetMetadata leidžia gauti dokumento metaduomenų objektus ir kartoti kolekciją, kad būtų rodomas metaduomenų pavadinimas ir reikšmės.

Kodas metaduomenų ištraukimui iš PDF naudojant C#

Sukūrėme C# skaitymo PDF metaduomenų programą, kad parodytume, kaip veikia metaduomenys iš dokumento funkcijos. Ši programa sukurta naudojant kelis API iškvietimus iš dokumentų duomenų išgavimo bibliotekos, nenustačius jokios papildomos programinės įrangos. Be to, šį pavyzdinį kodą galima vykdyti bet kurioje operacinėje sistemoje, pvz., MS Windows, Linux ir MacOS, kurios palaiko .NET aplinką.

 Latviski