Šiame straipsnyje mes sutelksime dėmesį į nuoseklų procesą, kaip ištraukti tekstą iš HTML C# ir kaip naudoti šį vadovą kuriant C# ištrauką Tekstas iš HTML funkcija. Šiame vadove reikia pateikti HTML dokumentą, skirtą tekstui išgauti naudojant kelis paprastus API iškvietimus. Žemiau galite pažvelgti į visą informaciją ir darbo pavyzdį, kaip išgauti tekstą iš HTML naudojant C#.
Veiksmai, kaip ištraukti tekstą iš HTML C#
- Įdiekite paketą GroupDocs.Parser for .NET iš NuGet svetainės .NET projekte, kad ištrauktumėte tekstą iš HTML
- Pridėkite nuorodą į reikiamas vardų sritis, kad ištrauktumėte tekstą iš HTML dokumento
- Sukurkite Parser klasės egzempliorių, kad įkeltumėte įvesties HTML dokumentą
- Iškvieskite Parser klasės metodą GetText, skirtą TextReader objektui rinkti
- Perskaitykite tekstą iš TextReader ir parodykite jį konsolėje
Ankstesnės nuoseklios instrukcijos leidžia greitai sukurti ištraukite tekstą iš HTML C# programos. Tai labai paprastos naudoti instrukcijos ir kiekvienas, turintis minimalią kūrimo patirtį, gali jomis vadovautis, kad gautų tekstą iš dokumentų. Be to, šiuos taškus galite naudoti bet kurioje iš įprastų operacinių sistemų, tokių kaip MS Windows, Linux ir macOS. Be to, galite skambinti API, kad išgautumėte tekstą, nenustatydami jokios papildomos programinės įrangos.
Kodas, skirtas ištraukti tekstą iš HTML C#
C# gauti tekstą iš HTML sukurtas atliekant ankstesniame skyriuje aprašytus veiksmus. Aukščiau pateiktame kodo fragmente matote, kad teksto ištraukimo procesas pradedamas sukonfigūravus reikiamą paketą ir pridedant nuorodą į reikiamas vardų sritis. Kituose žingsniuose mes įkėlėme įvesties HTML dokumentą, sukurdami Parser klasės egzempliorių, tada naudojome GetText metodą, kad gautume TextReader objektą ir galiausiai perskaitėme tekstą iš jo.
Aptarėme išsamias instrukcijas, kaip sukurti programą gauti tekstą iš HTML C#. Neseniai paskelbėme straipsnį apie metaduomenų ištraukimą iš Excel failo naudojant C#. Daugiau informacijos rasite kaip išgauti metaduomenis iš Excel failo C# vadove.