كيفية استخراج النص من HTML في C #

في هذه المقالة الإرشادية ، سنركز على العملية خطوة بخطوة ** لاستخراج النص من HTML في C # ** وكيفية استخدام هذا الدليل لتطوير ** C # extract Text from وظائف HTML **. يتطلب هذا الدليل تقديم مستند HTML لاستخراج النص عن طريق استهلاك بضع استدعاءات بسيطة لواجهة برمجة التطبيقات. أدناه يمكنك إلقاء نظرة على المعلومات الكاملة بالإضافة إلى مثال عملي لاستخراج النص من HTML باستخدام C #.

خطوات استخراج النص من HTML في C

  1. قم بتثبيت حزمة GroupDocs.Parser for .NET من موقع ويب NuGet في مشروع .NET لاستخراج النص من HTML
  2. أضف مرجعًا إلى مساحات الأسماء الضرورية لاستخراج النص من مستند HTML
  3. قم بإنشاء مثيل للفئة Parser لتحميل مستند إدخال HTML
  4. استدعاء الأسلوب GetText لفئة المحلل اللغوي لتجميع كائن TextReader
  5. اقرأ النص من TextReader واعرضه على وحدة التحكم

تمكّنك الإرشادات المتدرجة السابقة من إنشاء * استخراج النص بسرعة من تطبيق HTML C # *. هذه إرشادات سهلة الاستخدام للغاية ويمكن لأي شخص لديه أدنى خبرة في التطوير اتباعها للحصول على نص من المستندات. علاوة على ذلك ، يمكنك استهلاك هذه النقاط على أي من أنظمة التشغيل الشائعة مثل MS Windows و Linux و macOS. علاوة على ذلك ، يمكنك استدعاء واجهات برمجة التطبيقات لاستخراج النص دون إعداد أي برامج إضافية.

كود لاستخراج النص من HTML في C

using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using GroupDocs.Parser;
using GroupDocs.Parser.Data;
namespace ExtractTextFromHtmlInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to extract text from HTML using C#
{
// Remove the watermark in output
string licensePath = "GroupDocs.Parser.lic";
GroupDocs.Parser.License lic = new GroupDocs.Parser.License();
lic.SetLicense(licensePath);
// Create an instance of Parser class
using (Parser parser = new Parser("sample.html"))
{
// Extract a text into the reader
using(TextReader reader = parser.GetText())
{
// Print a text from the document
// If text extraction isn't supported, a reader is null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
}
}
}

تم تطوير * C # get Text from HTML * باتباع الخطوات الموضحة في القسم السابق. يمكنك أن ترى في مقتطف الشفرة أعلاه أن عملية استخراج النص قد بدأت من خلال تكوين الحزمة المطلوبة وإضافة المرجع إلى مساحات الأسماء الضرورية. في الخطوات التالية ، قمنا بتحميل مستند HTML للإدخال عن طريق إنشاء مثيل لفئة Parser ثم استخدم طريقة GetText للحصول على كائن TextReader وأخيراً قراءة النص منه.

لقد ناقشنا التعليمات التفصيلية لتطوير الحصول على النص من تطبيق HTML C #. لقد نشرنا مؤخرًا مقالة لاستخراج البيانات الوصفية من ملف Excel باستخدام C # ، ألق نظرة على دليل كيفية استخراج البيانات الوصفية من ملف Excel في C # لمزيد من المعلومات.

 عربي