W tym samouczku wyjaśniamy krok po kroku proces konwersji HTML na Text w języku C#. Ten przewodnik zawiera szczegółowe informacje na temat konfigurowania biblioteki konwertera dokumentów, instrukcje krok po kroku dotyczące przekształcania dokumentów oraz przykładowy kod funkcji Konwertuj kod HTML na zwykły tekst w języku C#. Oto szczegółowe instrukcje wraz z działającym przykładem konwersji kodu HTML na tekst przy użyciu języka C#.
Kroki konwersji HTML na tekst w C#
- Zainstaluj pakiet GroupDocs.Conversion for .NET z NuGet w projekcie .NET, aby zaimplementować funkcjonalność C# HTML do zwykłego tekstu
- Dodaj odwołanie do przestrzeni nazw GroupDocs.Conversion, aby przekształcić kod HTML w tekst
- Utwórz instancję klasy Converter i przekaż wejściowy plik HTML do jej konstruktora
- Zainicjuj klasę WordProcessingConvertOptions i zdefiniuj parametry do dostosowania dokumentu tekstowego
- Na koniec wywołaj metodę Convert, aby zapisać kod HTML jako tekst
Powyższe punkty pozwalają łatwo i szybko zaimplementować funkcjonalność pobierz zwykły tekst z HTML C#. Wystarczy zainstalować wymagany pakiet ze strony internetowej NuGet, napisać od trzech do czterech linii kodu i zużyć kilka wywołań API, aby ukończyć konwersję dokumentu. Co więcej, te kroki nie wymagają żadnego dodatkowego narzędzia innej firmy i można je wdrożyć w dowolnym systemie operacyjnym, takim jak MS Windows, Linux i Mac OS.
Kod do konwersji HTML na tekst w C#
using System; | |
using GroupDocs.Conversion.Options.Convert; | |
namespace ConvertHtmlToTextInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to convert HTML to Text using C# | |
{ | |
// Remove the watermark in output Text document by adding license | |
string licensePath = "GroupDocs.Conversion.lic"; | |
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License(); | |
lic.SetLicense(licensePath); | |
// Load the source HTML file for conversion to TXT | |
var converter = new GroupDocs.Conversion.Converter("sample.html"); | |
// Set the convert options for TXT file | |
WordProcessingConvertOptions convertOptions = new WordProcessingConvertOptions { | |
Format = GroupDocs.Conversion.FileTypes.WordProcessingFileType.Txt | |
}; | |
// Convert and save the HTML in TXT format | |
converter.Convert("converted.txt", convertOptions); | |
Console.WriteLine("Done"); | |
} | |
} | |
} |
Opracowaliśmy powyższy przykład, postępując zgodnie z instrukcjami zdefiniowanymi w poprzedniej sekcji, aby zaimplementować możliwość konwertowania kodu HTML na zwykły tekst w języku C#. Jak widać, użyliśmy klasy Converter do załadowania wejściowego dokumentu HTML i ustawienia formatu pliku wyjściowego poprzez konsumpcję obiektu WordProcessingConvertOptions. Na koniec wywołaliśmy metodę Convert w celu zapisania wynikowego pliku na dysku.
Skoncentrowaliśmy się na procesie konwersji dokumentów w celu zaimplementowania funkcji pobierania zwykłego tekstu z języka HTML w języku C#. Niedawno opublikowaliśmy artykuł dotyczący zmiany formatu PDF na CSV w języku C#. Zajrzyj do przewodnika jak przekonwertować PDF na CSV za pomocą C#, aby uzyskać więcej informacji.