Kaip konvertuoti HTML į tekstą C#

Šioje mokymo programoje paaiškiname nuoseklų procesą, kaip konvertuoti HTML į Text C#. Šiame vadove pateikiama išsami informacija, kaip nustatyti dokumentų keitiklio biblioteką, nuoseklios dokumento transformavimo instrukcijos ir pavyzdinis kodas, skirtas C# konvertuoti HTML į paprastą tekstą. Čia pateikiamos išsamios instrukcijos kartu su veikiančiu pavyzdžiu, kaip konvertuoti HTML į tekstą naudojant C#.

Veiksmai, kaip konvertuoti HTML į tekstą C#

  1. Įdiekite paketą GroupDocs.Conversion for .NET iš NuGet į .NET projektą, kad įdiegtumėte C# HTML į paprastą tekstą funkciją
  2. Pridėkite nuorodą į GroupDocs.Conversion vardų sritį, kad pakeistumėte HTML į tekstą
  3. Sukurkite Converter klasę ir perduokite įvesties HTML failą jos konstruktoriui
  4. Inicijuokite WordProcessingConvertOptions klasę ir apibrėžkite teksto dokumento tinkinimo parametrus
  5. Galiausiai iškvieskite konvertavimo metodą, kad išsaugotumėte HTML kaip tekstą

Aukščiau pateikti punktai leidžia lengvai ir greitai įdiegti funkciją gauti paprastą tekstą iš HTML C#. Jums tereikia įdiegti reikiamą paketą iš NuGet svetainės, parašyti tris ar keturias kodo eilutes ir sunaudoti kelis API iškvietimus, kad užbaigtumėte dokumento konvertavimą. Be to, šie veiksmai nereikalauja jokio papildomo trečiosios šalies įrankio ir gali būti įdiegti bet kurioje operacinėje sistemoje, pvz., MS Windows, Linux ir Mac OS.

Kodas konvertuoti HTML į tekstą C#

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertHtmlToTextInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert HTML to Text using C#
{
// Remove the watermark in output Text document by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source HTML file for conversion to TXT
var converter = new GroupDocs.Conversion.Converter("sample.html");
// Set the convert options for TXT file
WordProcessingConvertOptions convertOptions = new WordProcessingConvertOptions {
Format = GroupDocs.Conversion.FileTypes.WordProcessingFileType.Txt
};
// Convert and save the HTML in TXT format
converter.Convert("converted.txt", convertOptions);
Console.WriteLine("Done");
}
}
}

Aukščiau pateiktą pavyzdį sukūrėme vadovaudamiesi ankstesniame skyriuje pateiktomis instrukcijomis, kad įdiegtume konvertuoti HTML į paprastą tekstą C# galimybę. Kaip matote, įvesties HTML dokumento įkėlimui naudojome konverterio klasę ir nustatėme išvesties failo formatą naudodami objektą WordProcessingConvertOptions. Galų gale mes iškvietėme Konvertavimo metodą, skirtą gauto failo įrašymui į diską.

Mes sutelkėme dėmesį į dokumentų konvertavimo procesą, kad būtų galima įdiegti C# gauti paprastą tekstą iš HTML. Neseniai paskelbėme straipsnį, kaip pakeisti PDF į CSV C#. Daugiau informacijos rasite kaip konvertuoti PDF į CSV naudojant C# vadove.

 Latviski