Ebben az oktatóanyagban lépésről lépésre ismertetjük a dokumentumok konvertálásának folyamatát az egyik legjobb dokumentumkonvertáló könyvtár használatával, és megtanuljuk, hogyan lehet a PDF fájlt Text-re konvertálni C#-ban. Gyorsan megvalósíthatjuk a PDF to Text konverter C# funkciót az ebben az útmutatóban meghatározott eljárással. Ezen túlmenően ezek az utasítások nem igényelnek további harmadik féltől származó szoftvert, és bármilyen operációs rendszeren, például MS Windowson, Linuxon és Mac OS-en megvalósíthatók.
A PDF-ből szöveggé konvertálás lépései C#-ban
- Telepítse a GroupDocs.Conversion for .NET csomagot a NuGetből a .NET projektben a PDF szöveggé funkció megvalósításához
- Adjon hozzá hivatkozást a GroupDocs.Conversion névtérhez a PDF szöveggé alakításához
- Hozzon létre egy objektumot a Converter osztályból, és adja át a forrás PDF-fájlt a konstruktorának
- Inicializálja a WordProcessingConvertOptions osztályt, és határozzon meg paramétereket a szöveges dokumentum testreszabásához
- Végül hívja meg az Átalakító osztály Konvertálás metódusát a PDF szöveges dokumentumként való mentéséhez
Ezeken a pontokon a Converter osztály indítja el a PDF fájl betöltését, miután konfigurálta a könyvtárat a C# PDF konvertálása szöveggé képesség megvalósításához. Ezután állítsa be a kimeneti szövegfájl testreszabásának tulajdonságait a WordProcessingConvertOptions osztály inicializálásával. Végül a kimeneti szöveges dokumentumot a Konvertálás metódus meghívásával a lemezre menti.
Kód a PDF szöveggé konvertálásához C#-ban
using System; | |
using GroupDocs.Conversion.Options.Convert; | |
namespace ConvertPdfToTextInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to convert PDF to Text using C# | |
{ | |
// Remove the watermark in output PDF document by adding license | |
string licensePath = "GroupDocs.Conversion.lic"; | |
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License(); | |
lic.SetLicense(licensePath); | |
// Load the source PDF file for conversion to Text | |
var converterObj = new GroupDocs.Conversion.Converter("sample.pdf"); | |
// Set the conversion options for Text document to customize the output file | |
WordProcessingConvertOptions options = new WordProcessingConvertOptions { | |
Format = GroupDocs.Conversion.FileTypes.WordProcessingFileType.Txt | |
}; | |
// Convert and save the PDF in TXT format | |
converterObj.Convert("converted.txt", options); | |
Console.WriteLine("Done"); | |
} | |
} | |
} |
A convert PDF to text C# funkció a fenti részletben jön létre az előző részben ismertetett utasítások szerint. A dokumentumkonverziós könyvtár néhány API-hívását használtuk a PDF-fájl szöveggé alakításához. Számos dokumentumot átalakíthat szöveges formátumokká, beleértve a HTML, CSV, DOCX, DWF, EML, ODT, PNG és sok más formátumot.
A C# get text from PDF funkció megvalósításának dokumentumkonverziós folyamatára koncentráltunk. A közelmúltban közzétettünk egy cikket, amely a HTML-t szöveggé változtatja C#-ban. További információért tekintse meg a hogyan lehet HTML-t szöveggé konvertálni C# segítségével útmutatót.