Hogyan lehet szöveget kivonni a HTML-ből C#-ban

Ebben az útmutató cikkben a szöveg kibontásának lépésről lépésre a HTML webhelyről C#-ban való folyamatára fogunk összpontosítani, valamint arra, hogyan használhatjuk ezt az útmutatót a C# szöveg kivonatának fejlesztéséhez. HTML funkció. Ez a kézikönyv megköveteli, hogy biztosítsa a HTML-dokumentumot a szöveg kivonásához néhány egyszerű API-hívás igénybevételével. Az alábbiakban megtekintheti a teljes információt, valamint egy működő példát a szöveg HTML-ből C# használatával történő kinyerésére.

Lépések a szöveg kibontásához HTML-ből C#-ban

  1. Telepítse a GroupDocs.Parser for .NET csomagot a NuGet webhelyről a .NET projektben, hogy kivonja a szöveget a HTML-ből
  2. Adjon hozzá hivatkozást a szükséges névterekre a szöveg HTML-dokumentumból való kivonásához
  3. Hozzon létre egy példányt a Parser osztályból a bemeneti HTML-dokumentum betöltéséhez
  4. Hívja meg a Parser osztály GetText metódusát a TextReader objektum összegyűjtéséhez
  5. Olvassa el a szöveget a TextReaderből, és jelenítse meg a konzolon

Az előző lépésenkénti utasítások segítségével gyorsan létrehozhatja a extract Text from HTML C# alkalmazást. Ezek nagyon könnyen használható utasítások, és a minimális fejlesztési tapasztalattal rendelkezők követhetik őket, hogy szöveget kapjanak a dokumentumokból. Ezenkívül ezeket a pontokat felhasználhatja bármely általános operációs rendszeren, például MS Windowson, Linuxon és macOS-en. Ezenkívül további szoftverek beállítása nélkül hívhatja meg az API-kat a szöveg kivonásához.

Kód a szöveg HTML-ből történő kivonásához C#-ban

A C# get Text from HTML az előző részben ismertetett lépések követésével készült. A fenti kódrészleten látható, hogy a szövegkivonási folyamat a szükséges csomag konfigurálásával és a szükséges névterekhez való hivatkozás hozzáadásával indul. A következő lépésekben betöltjük a bemeneti HTML dokumentumot úgy, hogy létrehozunk egy példányt az Parser osztályból, majd a GetText metódussal szerezzük be a TextReader objektumot, végül beolvassuk belőle a szöveget.

Megbeszéltük a Get Text from HTML C# alkalmazás fejlesztésére vonatkozó részletes utasításokat. A közelmúltban közzétettünk egy cikket a metaadatok kinyeréséről az Excel fájlból C# használatával. További információért tekintse meg a hogyan lehet metaadatokat kivonni az Excel fájlból C#-ban útmutatót.

 Magyar