Ինչպես հանել մետատվյալները Word փաստաթղթից C#-ում

Այս հոդվածը տալիս է քայլ առ քայլ հրահանգներ այն մասին, թե ինչպես պետք է հանել մետատվյալները Word փաստաթղթից C# մի քանի պարզ API զանգերի միջոցով: Այս գրառման մեջ կարող եք նաև գտնել աշխատանքային կոդ՝ ** Word-ի մետատվյալները C#**-ով ստանալու համար: Այս ուղեցույցում նկարագրված աշխատանքային հոսքը կախված չէ որևէ այլ երրորդ կողմի գործիքից և կարող է հետևվել ցանկացած հայտնի օպերացիոն համակարգում, ինչպիսիք են Windows-ը, macOS-ը և Linux-ը, որոնք աջակցում են .NET միջավայր:

Word-ի փաստաթղթից C#-ում մետատվյալները հանելու քայլեր

  1. Տեղադրեք GroupDocs.Parser for .NET փաթեթը NuGet փաթեթի կառավարիչից .NET նախագծում` Word փաստաթղթից մետատվյալներ հանելու համար:
  2. Հղում ավելացրեք Word ֆայլից մետատվյալներ հանելու համար անհրաժեշտ անվանատարածքներին
  3. Ստեղծեք Parser դասը մուտքագրված DOCX ֆայլը բեռնելու համար
  4. Մետատվյալների հավաքածու ստանալու համար կանչեք Parser դասի GetMetadata մեթոդը
  5. Վերջապես, կրկնեք հավաքածուի վրա՝ մետատվյալների անվանումն ու արժեքը ստանալու համար

Վերոնշյալ աշխատանքային հոսքը թույլ է տալիս արագորեն ստեղծել * C#* մետատվյալների Word փաստաթուղթ ստանալու հնարավորություն: Դուք կարող եք սկզբնավորել Word-ի մետատվյալների արդյունահանման գործընթացը՝ կարգավորելով անհրաժեշտ փաթեթը և ներառելով անհրաժեշտ անվանատարածքը կոդի մեջ: Այս գործն ավարտելուց հետո դուք պետք է բեռնեք DOC կամ DOCX ֆայլը՝ սկզբնավորելով Parser դասը: Հաջորդ երկու քայլերում դուք պետք է զանգահարեք GetMetadata մեթոդը՝ մետատվյալների հավաքագրման համար, այնուհետև կրկնեք այն՝ հետագա մշակման համար:

Կոդ՝ Word-ի փաստաթղթից C#-ում մետատվյալներ հանելու համար

using System;
using System.Collections.Generic;
using GroupDocs.Parser;
using GroupDocs.Parser.Data;
namespace ExtractMetadataFromWordDocumentInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to extract Metadata from Word using C#
{
// Remove the watermark in output
string licensePath = "GroupDocs.Parser.lic";
GroupDocs.Parser.License lic = new GroupDocs.Parser.License();
lic.SetLicense(licensePath);
// Create an instance of Parser class
using (Parser parser = new Parser("sample.docx"))
{
// Extract metadata from the document
IEnumerable<MetadataItem> metadata = parser.GetMetadata();
// Check if metadata extraction is supported
if (metadata == null)
{
Console.WriteLine("Metatada extraction isn't supported");
}
// Iterate over metadata items
foreach (MetadataItem item in metadata)
{
// Print an item name and value
Console.WriteLine(string.Format("{0}: {1}", item.Name, item.Value));
}
}
}
}
}

C# մետատվյալների Word document հավելվածը մշակվել է ցուցադրման համար՝ օգտագործելով նախորդ բաժնում բացատրված հրահանգները: Մենք գրել ենք մի քանի տող կոդ և սպառել ենք մի քանի API զանգեր՝ Word ֆայլից մետատվյալներ հանելու համար: Ավելին, դուք կարող եք հեշտությամբ արդյունահանել մետատվյալներ այլ փաստաթղթերի ձևաչափերից, ինչպիսիք են DOC, DOCX, RTF, XLSX, PDF, PPTX, MSG, EML և շատ ավելին այս օրինակելի կոդի մի փոքր ճշգրտմամբ:

Մենք քննարկել ենք մետատվյալները Word փաստաթղթից C#-ի միջոցով հանելու մանրամասն հրահանգները և դրա համար մշակել ենք օրինակելի հավելված: Վերջերս մենք հրապարակեցինք հոդված C#-ի միջոցով PowerPoint-ից պատկերներ հանելու համար, լրացուցիչ տեղեկությունների համար դիտեք ինչպես հանել պատկերները PowerPoint-ից C#-ով ուղեցույցը: Եթե հետաքրքրված եք GroupDocs-ի արտադրանքի մասին ավելին իմանալով, այցելեք այս page:

 Հայերեն