如何在 C# 中将 HTML 转换为文本

在此操作指南中,我们将逐步解释在 C#** 中将 HTML 转换为 Text 的分步过程。本指南提供了设置文档转换器库的详细信息、进行文档转换的逐步说明以及C# 将 HTML 转换为纯文本 功能的示例代码。以下是使用 C# 将 HTML 转换为文本的详细说明以及工作示例。

在 C# 中将 HTML 转换为文本的步骤

  1. 在 .NET 项目中从 NuGet 安装 GroupDocs.Conversion for .NET 包,以实现 C# HTML 到纯文本功能
  2. 添加对 GroupDocs.Conversion 命名空间的引用以将 HTML 转换为文本
  3. 实例化 Converter 类并将输入的 HTML 文件传递给它的构造函数
  4. 初始化 WordProcessingConvertOptions 类并定义自定义文本文档的参数
  5. 最后,调用 Convert 方法将 HTML 保存为 Text

以上几点让您可以轻松快速地实现 get plain text from HTML C# 功能。您只需要从 NuGet 网站安装所需的包,编写三到四行代码,并使用几个 API 调用即可完成文档转换。此外,这些步骤不需要任何额外的第三方工具,并且可以在任何操作系统上实现,例如 MS Windows、Linux 和 Mac OS。

在 C# 中将 HTML 转换为文本的代码

我们按照上一节中定义的说明开发了上面的示例,以实现将 HTML 转换为纯文本 C# 功能。如您所见,我们使用 Converter 类来加载输入 HTML 文档并通过使用 WordProcessingConvertOptions 对象设置输出文件格式。最后,我们调用了 Convert 方法将生成的文件保存到磁盘。

我们专注于实现 C# 从 HTML 获取纯文本功能的文档转换过程。最近,我们发表了一篇使用 C# 将 PDF 转换为 CSV 的文章,请查看 如何使用 C# 将 PDF 转换为 CSV 指南了解更多信息。

 简体中文