Hogyan lehet PDF-et szöveggé konvertálni C#-ban

Ebben az oktatóanyagban lépésről lépésre ismertetjük a dokumentumok konvertálásának folyamatát az egyik legjobb dokumentumkonvertáló könyvtár használatával, és megtanuljuk, hogyan lehet a PDF fájlt Text-re konvertálni C#-ban. Gyorsan megvalósíthatjuk a PDF to Text konverter C# funkciót az ebben az útmutatóban meghatározott eljárással. Ezen túlmenően ezek az utasítások nem igényelnek további harmadik féltől származó szoftvert, és bármilyen operációs rendszeren, például MS Windowson, Linuxon és Mac OS-en megvalósíthatók.

A PDF-ből szöveggé konvertálás lépései C#-ban

  1. Telepítse a GroupDocs.Conversion for .NET csomagot a NuGetből a .NET projektben a PDF szöveggé funkció megvalósításához
  2. Adjon hozzá hivatkozást a GroupDocs.Conversion névtérhez a PDF szöveggé alakításához
  3. Hozzon létre egy objektumot a Converter osztályból, és adja át a forrás PDF-fájlt a konstruktorának
  4. Inicializálja a WordProcessingConvertOptions osztályt, és határozzon meg paramétereket a szöveges dokumentum testreszabásához
  5. Végül hívja meg az Átalakító osztály Konvertálás metódusát a PDF szöveges dokumentumként való mentéséhez

Ezeken a pontokon a Converter osztály indítja el a PDF fájl betöltését, miután konfigurálta a könyvtárat a C# PDF konvertálása szöveggé képesség megvalósításához. Ezután állítsa be a kimeneti szövegfájl testreszabásának tulajdonságait a WordProcessingConvertOptions osztály inicializálásával. Végül a kimeneti szöveges dokumentumot a Konvertálás metódus meghívásával a lemezre menti.

Kód a PDF szöveggé konvertálásához C#-ban

using System;
using GroupDocs.Conversion.Options.Convert;
namespace ConvertPdfToTextInCSharp
{
class Program
{
public static void Main(string[] args) // Main function to convert PDF to Text using C#
{
// Remove the watermark in output PDF document by adding license
string licensePath = "GroupDocs.Conversion.lic";
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License();
lic.SetLicense(licensePath);
// Load the source PDF file for conversion to Text
var converterObj = new GroupDocs.Conversion.Converter("sample.pdf");
// Set the conversion options for Text document to customize the output file
WordProcessingConvertOptions options = new WordProcessingConvertOptions {
Format = GroupDocs.Conversion.FileTypes.WordProcessingFileType.Txt
};
// Convert and save the PDF in TXT format
converterObj.Convert("converted.txt", options);
Console.WriteLine("Done");
}
}
}

A convert PDF to text C# funkció a fenti részletben jön létre az előző részben ismertetett utasítások szerint. A dokumentumkonverziós könyvtár néhány API-hívását használtuk a PDF-fájl szöveggé alakításához. Számos dokumentumot átalakíthat szöveges formátumokká, beleértve a HTML, CSV, DOCX, DWF, EML, ODT, PNG és sok más formátumot.

A C# get text from PDF funkció megvalósításának dokumentumkonverziós folyamatára koncentráltunk. A közelmúltban közzétettünk egy cikket, amely a HTML-t szöveggé változtatja C#-ban. További információért tekintse meg a hogyan lehet HTML-t szöveggé konvertálni C# segítségével útmutatót.

 Magyar