In diesem Anleitungsartikel konzentrieren wir uns auf den schrittweisen Prozess zum Extrahieren von Text aus HTML in C# und die Verwendung dieses Leitfadens für die Entwicklung des C#-Extrahierens von Text aus HTML-Funktionalität. Dieses Handbuch erfordert, dass Sie das HTML-Dokument zum Extrahieren von Text bereitstellen, indem Sie einige einfache API-Aufrufe verwenden. Unten können Sie sich die vollständigen Informationen sowie ein funktionierendes Beispiel zum Extrahieren von Text aus HTML mit C# ansehen.
Schritte zum Extrahieren von Text aus HTML in C#
- Installieren Sie das Paket GroupDocs.Parser for .NET von der NuGet-Website im .NET-Projekt, um Text aus HTML zu extrahieren
- Fügen Sie einen Verweis auf die erforderlichen Namespaces zum Extrahieren von Text aus dem HTML-Dokument hinzu
- Erstellen Sie eine Instanz der Klasse Parser zum Laden des Eingabe-HTML-Dokuments
- Rufen Sie die GetText-Methode der Parser-Klasse zum Sammeln des TextReader-Objekts auf
- Lesen Sie den Text aus dem TextReader und zeigen Sie ihn auf der Konsole an
Mit den vorangegangenen schrittweisen Anweisungen können Sie schnell die Anwendung Extract Text from HTML C# erstellen. Dies sind sehr einfach zu verwendende Anweisungen und jeder mit der minimalen Entwicklungserfahrung kann ihnen folgen, um einen Text aus Dokumenten zu erhalten. Darüber hinaus können Sie diese Punkte auf allen gängigen Betriebssystemen wie MS Windows, Linux und macOS nutzen. Darüber hinaus können Sie die APIs zum Extrahieren von Text aufrufen, ohne zusätzliche Software einzurichten.
Code zum Extrahieren von Text aus HTML in C#
C# get Text from HTML wird entwickelt, indem die im vorherigen Abschnitt erläuterten Schritte befolgt werden. Sie können im obigen Codeausschnitt sehen, dass der Textextraktionsprozess gestartet wird, indem Sie das erforderliche Paket konfigurieren und die Referenz zu den erforderlichen Namespaces hinzufügen. In den nächsten Schritten haben wir das Eingabe-HTML-Dokument geladen, indem wir eine Instanz der Parser-Klasse erstellt haben und dann die GetText-Methode verwenden, um das TextReader-Objekt zu erhalten und schließlich den Text daraus zu lesen.
Wir haben die detaillierten Anweisungen zum Entwickeln der C#-Anwendung zum Abrufen von Text aus HTML besprochen. Kürzlich haben wir einen Artikel zum Extrahieren von Metadaten aus Excel-Dateien mit C# veröffentlicht. Weitere Informationen finden Sie im So extrahieren Sie Metadaten aus einer Excel-Datei in C#-Leitfaden.