Jak przekonwertować HTML na tekst w C#

W tym samouczku wyjaśniamy krok po kroku proces konwersji HTML na Text w języku C#. Ten przewodnik zawiera szczegółowe informacje na temat konfigurowania biblioteki konwertera dokumentów, instrukcje krok po kroku dotyczące przekształcania dokumentów oraz przykładowy kod funkcji Konwertuj kod HTML na zwykły tekst w języku C#. Oto szczegółowe instrukcje wraz z działającym przykładem konwersji kodu HTML na tekst przy użyciu języka C#.

Kroki konwersji HTML na tekst w C#

  1. Zainstaluj pakiet GroupDocs.Conversion for .NET z NuGet w projekcie .NET, aby zaimplementować funkcjonalność C# HTML do zwykłego tekstu
  2. Dodaj odwołanie do przestrzeni nazw GroupDocs.Conversion, aby przekształcić kod HTML w tekst
  3. Utwórz instancję klasy Converter i przekaż wejściowy plik HTML do jej konstruktora
  4. Zainicjuj klasę WordProcessingConvertOptions i zdefiniuj parametry do dostosowania dokumentu tekstowego
  5. Na koniec wywołaj metodę Convert, aby zapisać kod HTML jako tekst

Powyższe punkty pozwalają łatwo i szybko zaimplementować funkcjonalność pobierz zwykły tekst z HTML C#. Wystarczy zainstalować wymagany pakiet ze strony internetowej NuGet, napisać od trzech do czterech linii kodu i zużyć kilka wywołań API, aby ukończyć konwersję dokumentu. Co więcej, te kroki nie wymagają żadnego dodatkowego narzędzia innej firmy i można je wdrożyć w dowolnym systemie operacyjnym, takim jak MS Windows, Linux i Mac OS.

Kod do konwersji HTML na tekst w C#

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertHtmlToTextInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert HTML to Text using C#
{
// Remove the watermark in output Text document by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source HTML file for conversion to TXT
var converter = new GroupDocs.Conversion.Converter("sample.html");
// Set the convert options for TXT file
WordProcessingConvertOptions convertOptions = new WordProcessingConvertOptions {
Format = GroupDocs.Conversion.FileTypes.WordProcessingFileType.Txt
};
// Convert and save the HTML in TXT format
converter.Convert("converted.txt", convertOptions);
Console.WriteLine("Done");
}
}
}

Opracowaliśmy powyższy przykład, postępując zgodnie z instrukcjami zdefiniowanymi w poprzedniej sekcji, aby zaimplementować możliwość konwertowania kodu HTML na zwykły tekst w języku C#. Jak widać, użyliśmy klasy Converter do załadowania wejściowego dokumentu HTML i ustawienia formatu pliku wyjściowego poprzez konsumpcję obiektu WordProcessingConvertOptions. Na koniec wywołaliśmy metodę Convert w celu zapisania wynikowego pliku na dysku.

Skoncentrowaliśmy się na procesie konwersji dokumentów w celu zaimplementowania funkcji pobierania zwykłego tekstu z języka HTML w języku C#. Niedawno opublikowaliśmy artykuł dotyczący zmiany formatu PDF na CSV w języku C#. Zajrzyj do przewodnika jak przekonwertować PDF na CSV za pomocą C#, aby uzyskać więcej informacji.

 Polski