Šioje mokymo programoje paaiškiname nuoseklią dokumentų konvertavimo procedūrą naudojant vieną geriausių dokumentų keitiklio biblioteką ir sužinome, kaip konvertuoti PDF į Text C#. Naudodami šiame vadove aprašytą procesą galime greitai įdiegti PDF į tekstą konverterio C# funkciją. Be to, šios instrukcijos nereikalauja jokios papildomos trečiosios šalies programinės įrangos ir gali būti įdiegtos bet kurioje operacinėje sistemoje, pvz., MS Windows, Linux ir Mac OS.
Veiksmai, kaip konvertuoti PDF į tekstą C#
- Įdiekite GroupDocs.Conversion for .NET paketą iš NuGet į .NET projektą, kad įdiegtumėte PDF į tekstą funkciją
- Pridėkite nuorodą į GroupDocs.Conversion vardų erdvę, kad PDF konvertuotumėte į tekstą
- Sukurkite Converter klasės objektą ir perduokite šaltinio PDF failą jo konstruktoriui
- Inicijuokite WordProcessingConvertOptions klasę ir apibrėžkite teksto dokumento tinkinimo parametrus
- Galiausiai, norėdami išsaugoti PDF kaip tekstinį dokumentą, iškvieskite konverterio klasės metodą Konvertuoti
Šiuose taškuose konverterio klasė pradedama įkelti PDF failą sukonfigūravus biblioteką, kad būtų įdiegta C# konvertuoti PDF į tekstą galimybė. Tada nustatykite išvesties teksto failo tinkinimo ypatybes inicijuodami WordProcessingConvertOptions klasę. Galų gale išvesties teksto dokumentas išsaugomas diske, iškviečiant konvertavimo metodą.
Kodas konvertuoti PDF į tekstą C#
using System; | |
using GroupDocs.Conversion.Options.Convert; | |
namespace ConvertPdfToTextInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to convert PDF to Text using C# | |
{ | |
// Remove the watermark in output PDF document by adding license | |
string licensePath = "GroupDocs.Conversion.lic"; | |
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License(); | |
lic.SetLicense(licensePath); | |
// Load the source PDF file for conversion to Text | |
var converterObj = new GroupDocs.Conversion.Converter("sample.pdf"); | |
// Set the conversion options for Text document to customize the output file | |
WordProcessingConvertOptions options = new WordProcessingConvertOptions { | |
Format = GroupDocs.Conversion.FileTypes.WordProcessingFileType.Txt | |
}; | |
// Convert and save the PDF in TXT format | |
converterObj.Convert("converted.txt", options); | |
Console.WriteLine("Done"); | |
} | |
} | |
} |
Funkcija konvertuoti PDF į tekstą C# yra sukurta aukščiau esančiame fragmente, naudojant instrukcijas, paaiškintas ankstesniame skyriuje. Naudojome kelis API iškvietimus iš dokumentų konvertavimo bibliotekos, kad pakeistume PDF į tekstą. Taip pat galite paversti įvairius dokumentus į teksto formatus, įskaitant HTML, CSV, DOCX, DWF, EML, ODT, PNG ir daugelį kitų.
Mes sutelkėme dėmesį į dokumentų konvertavimo procesą, skirtą C# gauti tekstą iš PDF funkciją. Neseniai paskelbėme straipsnį, kaip pakeisti HTML į tekstą C#. Daugiau informacijos rasite kaip konvertuoti HTML į tekstą naudojant C# vadove.