在本教程中,我们将解释使用最好的文档转换器库之一执行文档转换的分步过程,并学习如何在 C#** 中将 PDF 转换为 Text。我们可以使用本指南中定义的流程快速实现PDF 到文本转换器 C# 功能。此外,这些说明不需要任何额外的第三方软件,并且可以在任何操作系统上实施,例如 MS Windows、Linux 和 Mac OS。
在 C# 中将 PDF 转换为文本的步骤
- 在 .NET 项目中从 NuGet 安装 GroupDocs.Conversion for .NET 包,以实现 PDF 到文本功能
- 添加对 GroupDocs.Conversion 命名空间的引用以将 PDF 转换为文本
- 创建 Converter 类的对象并将源 PDF 文件传递给其构造函数
- 初始化 WordProcessingConvertOptions 类并定义自定义文本文档的参数
- 最后调用 Converter 类的 Convert 方法,将 PDF 保存为 Text 文档
在这些点中,在配置库以实现 C# 将 PDF 转换为文本 功能后,将启动 Converter 类以加载 PDF 文件。然后,通过初始化 WordProcessingConvertOptions 类来设置自定义输出文本文件的属性。最后,通过调用 Convert 方法将输出的 Text 文档保存到磁盘。
在 C# 中将 PDF 转换为文本的代码
convert PDF to text C# 功能是使用上一节中解释的说明在上述代码段中创建的。我们使用了文档转换库的一些 API 调用来将 PDF 转换为文本。您还可以将各种文档转换为文本格式,包括 HTML、CSV、DOCX、DWF、EML、ODT、PNG 等等。
我们专注于实现 C# 从 PDF 获取文本功能的文档转换过程。最近,我们发表了一篇文章,将 HTML 转换为 C# 中的文本,请查看 如何使用 C# 将 HTML 转换为文本 指南了解更多信息。