Как да конвертирате PDF в текст в C#

В този урок обясняваме стъпка по стъпка процедурата за извършване на конвертиране на документи с помощта на една от най-добрите библиотеки за конвертиране на документи и научаваме как да конвертирате PDF в Text в C#. Можем бързо да внедрим функционалността на PDF to Text converter C#, като използваме процеса, определен в това ръководство. Освен това, тези инструкции не изискват допълнителен софтуер на трети страни и могат да бъдат внедрени на всяка операционна система като MS Windows, Linux и Mac OS.

Стъпки за конвертиране на PDF в текст в C#

  1. Инсталирайте пакета GroupDocs.Conversion for .NET от NuGet в проекта .NET за внедряване на функционалността от PDF към текст
  2. Добавете препратка към пространството на имената GroupDocs.Conversion, за да трансформирате PDF в текст
  3. Създайте обект от класа Converter и предайте изходния PDF файл на неговия конструктор
  4. Инициализирайте клас WordProcessingConvertOptions и дефинирайте параметри за персонализиране на текстовия документ
  5. Накрая извикайте метода Convert на класа Converter, за да запазите PDF като текстов документ

В тези точки класът Converter се инициира за зареждане на PDF файла след конфигуриране на библиотеката за внедряване на възможността за C# конвертиране на PDF в текст. След това задайте свойства за персонализиране на изходния текстов файл чрез инициализиране на клас WordProcessingConvertOptions. В крайна сметка изходният текстов документ се записва на диска чрез извикване на метода Convert.

Код за конвертиране на PDF в текст в C#

Функционалността конвертиране на PDF в текст C# се създава в горния фрагмент чрез използване на инструкциите, обяснени в предишния раздел. Използвахме няколко извиквания на API на библиотеката за конвертиране на документи, за да променим PDF в текст. Можете също така да трансформирате различни документи в текстови формати, включително HTML, CSV, DOCX, DWF, EML, ODT, PNG и много други.

Съсредоточихме се върху процеса на преобразуване на документи за прилагане на C# функцията за получаване на текст от PDF. Наскоро публикувахме статия за промяна на HTML към текст в C#, вижте ръководството как да конвертирате HTML в текст с помощта на C# за повече информация.

 Български