V tomto tutoriálu vysvětlíme krok za krokem postup provádění převodu dokumentů pomocí jedné z nejlepších knihoven pro převod dokumentů a naučíme se, jak převést PDF na Text v C#. Pomocí procesu definovaného v této příručce můžeme rychle implementovat funkci převodníku PDF na text C#. Dále tyto pokyny nevyžadují žádný další software třetích stran a lze je implementovat na jakýkoli operační systém, jako je MS Windows, Linux a Mac OS.
Kroky k převodu PDF na text v C#
- Nainstalujte balíček GroupDocs.Conversion for .NET z projektu NuGet v projektu .NET pro implementaci funkce PDF na text
- Přidejte odkaz na jmenný prostor GroupDocs.Conversion pro transformaci PDF na text
- Vytvořte objekt třídy Converter a předejte zdrojový soubor PDF jeho konstruktoru
- Inicializujte třídu WordProcessingConvertOptions a definujte parametry pro přizpůsobení textového dokumentu
- Nakonec zavolejte metodu Convert třídy Converter a uložte PDF jako textový dokument
V těchto bodech je třída Converter iniciována pro načtení souboru PDF po konfiguraci knihovny pro implementaci schopnosti C# převést PDF na text. Poté nastavte vlastnosti pro přizpůsobení výstupního textového souboru inicializací třídy WordProcessingConvertOptions. Nakonec se výstupní textový dokument uloží na disk voláním metody Convert.
Kód pro převod PDF na text v C#
Funkce převést PDF na text C# je vytvořena ve výše uvedeném úryvku pomocí pokynů vysvětlených v předchozí části. Ke změně PDF na text jsme použili několik volání API knihovny pro převod dokumentů. Můžete také transformovat různé dokumenty do textových formátů včetně HTML, CSV, DOCX, DWF, EML, ODT, PNG a mnoha dalších.
Soustředili jsme se na proces konverze dokumentů pro implementaci funkce C# get text from PDF. Nedávno jsme publikovali článek o změně HTML na Text v C#. Další informace naleznete v průvodci jak převést HTML na text pomocí C#.