วิธีแยกข้อความจาก HTML ใน C#

ในบทความเชิงปฏิบัตินี้ เราจะมุ่งเน้นไปที่กระบวนการทีละขั้นตอนในการ แยกข้อความจาก HTML ใน C# และวิธีใช้คู่มือนี้สำหรับการพัฒนา C# แยกข้อความจาก ฟังก์ชัน HTML คู่มือนี้กำหนดให้คุณต้องเตรียมเอกสาร HTML เพื่อแยกข้อความโดยใช้การเรียก API ง่ายๆ 2-3 ครั้ง ด้านล่างนี้ คุณสามารถดูข้อมูลทั้งหมดรวมถึงตัวอย่างการทำงานเพื่อแยกข้อความจาก HTML โดยใช้ C#

ขั้นตอนในการดึงข้อความจาก HTML ใน C#

  1. ติดตั้งแพ็คเกจ GroupDocs.Parser for .NET จากเว็บไซต์ NuGet ในโครงการ .NET เพื่อแยกข้อความออกจาก HTML
  2. เพิ่มการอ้างอิงเนมสเปซที่จำเป็นสำหรับการแยกข้อความจากเอกสาร HTML
  3. สร้างอินสแตนซ์ของคลาส Parser สำหรับการโหลดเอกสาร HTML อินพุต
  4. เรียกใช้เมธอด GetText ของคลาส Parser เพื่อรวบรวมวัตถุ TextReader
  5. อ่านข้อความจาก TextReader และแสดงบนคอนโซล

คำแนะนำแบบขั้นตอนก่อนหน้านี้ช่วยให้คุณสร้าง extract Text จากแอปพลิเคชัน HTML C# ได้อย่างรวดเร็ว คำแนะนำเหล่านี้ใช้งานง่ายมากและทุกคนที่มีประสบการณ์การพัฒนาขั้นต่ำสามารถปฏิบัติตามเพื่อรับข้อความจากเอกสาร นอกจากนี้ คุณสามารถใช้คะแนนเหล่านี้บนระบบปฏิบัติการทั่วไป เช่น MS Windows, Linux และ macOS นอกจากนี้ คุณสามารถเรียกใช้ API เพื่อแยกข้อความโดยไม่ต้องตั้งค่าซอฟต์แวร์เพิ่มเติม

รหัสเพื่อแยกข้อความจาก HTML ใน C

C# รับข้อความจาก HTML ได้รับการพัฒนาโดยทำตามขั้นตอนที่อธิบายไว้ในส่วนก่อนหน้า คุณสามารถดูข้อมูลโค้ดด้านบนได้ว่ากระบวนการแยกข้อความเริ่มต้นโดยการกำหนดค่าแพ็คเกจที่จำเป็นและเพิ่มการอ้างอิงไปยังเนมสเปซที่จำเป็น ในขั้นตอนถัดไป เราได้โหลดเอกสาร HTML อินพุตโดยสร้างอินสแตนซ์ของคลาส Parser จากนั้นใช้เมธอด GetText เพื่อขอรับวัตถุ TextReader และสุดท้ายก็อ่านข้อความจากมัน

เราได้กล่าวถึงคำแนะนำโดยละเอียดในการพัฒนาแอปพลิเคชันรับข้อความจาก HTML C# เมื่อเร็ว ๆ นี้ เราได้เผยแพร่บทความเกี่ยวกับการแยกข้อมูลเมตาจากไฟล์ Excel โดยใช้ C# โปรดดูคำแนะนำ วิธีแยกข้อมูลเมตาจากไฟล์ Excel ใน C # สำหรับข้อมูลเพิ่มเติม

 ไทย