In deze korte zelfstudie worden de gedetailleerde instructies uitgelegd om tekst uit PDF in C# te extraheren. Het biedt ook de voorbeeldtoepassing om de implementatie te tonen om tekst uit PDF te extraheren met C#. Deze handleiding gebruikt een van de populaire pakketten voor het extraheren van documentgegevens uit verschillende documentformaten. Hieronder staan de kernstappen en een voorbeeldcode om een tekst uit een PDF te halen.
Stappen om tekst uit PDF te extraheren in C#
- Stel het GroupDocs.Parser for .NET-pakket in vanuit de NuGet-pakketbeheerder in de .NET-toepassing om tekst uit PDF te extraheren
- Voeg een verwijzing toe naar de essentiële naamruimten voor het extraheren van de tekst uit het PDF-document
- Instantieer de klasse Parser voor het laden van het ingevoerde PDF-document
- Roep de GetText-methode aan en verkrijg een tekstlezerobject
- Lees ten slotte de tekst van de reader en geef deze weer
We hebben alle belangrijke stappen op een rij gezet om de C# tekstextractie uit PDF-toepassing te ontwikkelen. Deze instructies voor het extraheren van tekst uit PDF kunnen worden gebruikt op elk platform zoals MS Windows, Linux en macOS dat een .NET-omgeving ondersteunt en zelfs zonder software van derden te installeren. U moet een paar regels code schrijven die bestaat uit API-aanroepen van de documentextractiebibliotheek.
Code om tekst uit PDF te extraheren in C#
In het bovenstaande codefragment hebben we de toepassing C# read PDF text ontwikkeld om u te laten zien hoe u een tekst uit de documenten haalt. We hebben in dit voorbeeld een PDF-bestand gebruikt voor het extraheren van tekst, maar u kunt tekst uit verschillende andere documenten extraheren, zoals DOC, DOCX, XLS, XLSX, PPTX, MSG, XML, ZIP en nog veel meer.
We hebben het proces om de C# get text from PDF-functionaliteit te implementeren in detail besproken en er een voorbeeldcode voor gemaakt. Onlangs hebben we een artikel gepubliceerd voor het extraheren van metadata uit PDF in C#, bekijk de hoe metadata uit PDF te extraheren met C# handleiding voor meer informatie.