این مقاله دستورالعملهای گام به گام در مورد نحوه استخراج فراداده از سند Word در سی شارپ با چند فراخوانی ساده API ارائه میدهد. همچنین می توانید یک کد نمونه کار برای دریافت ابرداده های Word با استفاده از C# را در این پست بیابید. گردش کار شرح داده شده در این راهنما به هیچ ابزار شخص ثالث دیگری بستگی ندارد و می توان آن را در هر یک از سیستم عامل های محبوب مانند Windows، macOS و Linux که از محیط دات نت پشتیبانی می کنند، دنبال کرد.
مراحل استخراج متادیتا از سند ورد در سی شارپ
- راه اندازی بسته GroupDocs.Parser for .NET از مدیر بسته NuGet در پروژه دات نت برای استخراج فراداده از سند Word
- برای استخراج متادیتا از فایل ورد، یک مرجع به فضاهای نام لازم اضافه کنید
- کلاس Parser را برای بارگیری فایل ورودی DOCX نمونه سازی کنید
- برای بدست آوردن مجموعه ابرداده، متد GetMetadata کلاس Parser را فراخوانی کنید
- در نهایت، روی مجموعه تکرار کنید تا نام و ارزش ابرداده را بدست آورید
گردش کار بالا شما را قادر می سازد تا به سرعت قابلیت دریافت ابرداده سند Word در C# را ایجاد کنید. می توانید با تنظیم بسته مورد نیاز و گنجاندن فضای نام لازم در کد، فرآیند استخراج فراداده Word را مقداردهی اولیه کنید. پس از انجام این کار، باید فایل DOC یا DOCX را با مقداردهی اولیه کلاس Parser بارگیری کنید. در دو مرحله بعدی، باید متد GetMetadata را برای جمع آوری ابرداده فراخوانی کنید و سپس آن را برای پردازش بیشتر تکرار کنید.
کد استخراج ابرداده از سند ورد در سی شارپ
using System; | |
using System.Collections.Generic; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractMetadataFromWordDocumentInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract Metadata from Word using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.docx")) | |
{ | |
// Extract metadata from the document | |
IEnumerable<MetadataItem> metadata = parser.GetMetadata(); | |
// Check if metadata extraction is supported | |
if (metadata == null) | |
{ | |
Console.WriteLine("Metatada extraction isn't supported"); | |
} | |
// Iterate over metadata items | |
foreach (MetadataItem item in metadata) | |
{ | |
// Print an item name and value | |
Console.WriteLine(string.Format("{0}: {1}", item.Name, item.Value)); | |
} | |
} | |
} | |
} | |
} |
برنامه C# ابرداده Word document برای نمایش با استفاده از دستورالعمل های توضیح داده شده در بخش قبلی توسعه داده شده است. ما چند خط کد نوشته ایم و چند فراخوانی API برای استخراج ابرداده از یک فایل Word مصرف کرده ایم. علاوه بر این، میتوانید به راحتی ابردادهها را از فرمتهای سند دیگر مانند DOC، DOCX، RTF، XLSX، PDF، PPTX، MSG، EML و بسیاری دیگر با کمی تغییر در این کد نمونه استخراج کنید.
ما دستورالعملهای دقیق استخراج فراداده از سند ورد با استفاده از سی شارپ را مورد بحث قرار دادهایم و یک برنامه نمونه برای آن توسعه دادهایم. اخیراً مقاله ای برای استخراج تصاویر از پاورپوینت با استفاده از سی شارپ منتشر کرده ایم، برای اطلاعات بیشتر به راهنمای نحوه استخراج تصاویر از پاورپوینت در سی شارپ مراجعه کنید. اگر علاقه مند به کسب اطلاعات بیشتر در مورد محصولات GroupDocs هستید، از این page دیدن کنید.