Այս հոդվածը տալիս է քայլ առ քայլ հրահանգներ այն մասին, թե ինչպես պետք է հանել մետատվյալները Word փաստաթղթից C# մի քանի պարզ API զանգերի միջոցով: Այս գրառման մեջ կարող եք նաև գտնել աշխատանքային կոդ՝ ** Word-ի մետատվյալները C#**-ով ստանալու համար: Այս ուղեցույցում նկարագրված աշխատանքային հոսքը կախված չէ որևէ այլ երրորդ կողմի գործիքից և կարող է հետևվել ցանկացած հայտնի օպերացիոն համակարգում, ինչպիսիք են Windows-ը, macOS-ը և Linux-ը, որոնք աջակցում են .NET միջավայր:
Word-ի փաստաթղթից C#-ում մետատվյալները հանելու քայլեր
- Տեղադրեք GroupDocs.Parser for .NET փաթեթը NuGet փաթեթի կառավարիչից .NET նախագծում` Word փաստաթղթից մետատվյալներ հանելու համար:
- Հղում ավելացրեք Word ֆայլից մետատվյալներ հանելու համար անհրաժեշտ անվանատարածքներին
- Ստեղծեք Parser դասը մուտքագրված DOCX ֆայլը բեռնելու համար
- Մետատվյալների հավաքածու ստանալու համար կանչեք Parser դասի GetMetadata մեթոդը
- Վերջապես, կրկնեք հավաքածուի վրա՝ մետատվյալների անվանումն ու արժեքը ստանալու համար
Վերոնշյալ աշխատանքային հոսքը թույլ է տալիս արագորեն ստեղծել * C#* մետատվյալների Word փաստաթուղթ ստանալու հնարավորություն: Դուք կարող եք սկզբնավորել Word-ի մետատվյալների արդյունահանման գործընթացը՝ կարգավորելով անհրաժեշտ փաթեթը և ներառելով անհրաժեշտ անվանատարածքը կոդի մեջ: Այս գործն ավարտելուց հետո դուք պետք է բեռնեք DOC կամ DOCX ֆայլը՝ սկզբնավորելով Parser դասը: Հաջորդ երկու քայլերում դուք պետք է զանգահարեք GetMetadata մեթոդը՝ մետատվյալների հավաքագրման համար, այնուհետև կրկնեք այն՝ հետագա մշակման համար:
Կոդ՝ Word-ի փաստաթղթից C#-ում մետատվյալներ հանելու համար
using System; | |
using System.Collections.Generic; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractMetadataFromWordDocumentInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract Metadata from Word using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.docx")) | |
{ | |
// Extract metadata from the document | |
IEnumerable<MetadataItem> metadata = parser.GetMetadata(); | |
// Check if metadata extraction is supported | |
if (metadata == null) | |
{ | |
Console.WriteLine("Metatada extraction isn't supported"); | |
} | |
// Iterate over metadata items | |
foreach (MetadataItem item in metadata) | |
{ | |
// Print an item name and value | |
Console.WriteLine(string.Format("{0}: {1}", item.Name, item.Value)); | |
} | |
} | |
} | |
} | |
} |
C# մետատվյալների Word document հավելվածը մշակվել է ցուցադրման համար՝ օգտագործելով նախորդ բաժնում բացատրված հրահանգները: Մենք գրել ենք մի քանի տող կոդ և սպառել ենք մի քանի API զանգեր՝ Word ֆայլից մետատվյալներ հանելու համար: Ավելին, դուք կարող եք հեշտությամբ արդյունահանել մետատվյալներ այլ փաստաթղթերի ձևաչափերից, ինչպիսիք են DOC, DOCX, RTF, XLSX, PDF, PPTX, MSG, EML և շատ ավելին այս օրինակելի կոդի մի փոքր ճշգրտմամբ:
Մենք քննարկել ենք մետատվյալները Word փաստաթղթից C#-ի միջոցով հանելու մանրամասն հրահանգները և դրա համար մշակել ենք օրինակելի հավելված: Վերջերս մենք հրապարակեցինք հոդված C#-ի միջոցով PowerPoint-ից պատկերներ հանելու համար, լրացուցիչ տեղեկությունների համար դիտեք ինչպես հանել պատկերները PowerPoint-ից C#-ով ուղեցույցը: Եթե հետաքրքրված եք GroupDocs-ի արտադրանքի մասին ավելին իմանալով, այցելեք այս page: