在某些情况下,您需要在 Web 上提供 PDF 内容或将其集成到 Web 应用程序中。您需要将 PDF(可移植文档格式)文件转换为 HTML(超文本标记语言)。 HTML 是在线呈现 PDF 的灵活选项,因为它是用作 Web 浏览器中内容呈现标准的语言。这篇内容全面的文章将指导您如何使用 C# 将 PDF 呈现为 HTML。下面,您将找到 使用 C# 创建包含 PDF 中嵌入资源的 HTML 的基本步骤以及代码示例。
使用 C# 将 PDF 渲染为 HTML 的步骤
- 使用 NuGet 包管理器安装 GroupDocs.Viewer for .NET 以将 PDF 渲染为 HTML
- 将 GroupDocs.Viewer 引用添加到您的项目中以将 PDF 转换为 HTML
- 通过将输入 PDF 文件路径作为参数传递给其构造函数来创建 Viewer 类的对象
- 调用 HtmlViewOptions.ForEmbeddedResources 方法获取视图选项
- 使用视图选项调用 Viewer.View 方法将 PDF 文件呈现为 HTML
由于所有在线浏览器都接受 HTML,因此大量受众无需安装其他软件即可访问您的内容。本教程中使用的查看器库可以在各种平台上完美运行。如果您的系统上安装了 .NET,则可以在 Windows、macOS 和 Linux 等广泛使用的操作系统上轻松按照上面提供的说明使用 C# 从 PDF 渲染 HTML,没有任何挑战。下面的代码示例说明了渲染过程。
使用 C# 将 PDF 呈现为 HTML 的代码
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
using GroupDocs.Viewer; | |
using GroupDocs.Viewer.Options; | |
namespace RenderPDFasHTMLUsingCSharp | |
{ | |
internal class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Set License to avoid the limitations of Viewer library | |
License lic = new License(); | |
lic.SetLicense(@"GroupDocs.Viewer.lic"); | |
using (var viewer = new Viewer("input.pdf")) | |
{ | |
// Create an HTML file for each PDF page. | |
// {0} is replaced with the current page number in the file name. | |
var viewOptions = HtmlViewOptions.ForEmbeddedResources("page_{0}.html"); | |
viewer.View(viewOptions); | |
} | |
} | |
} | |
} |
按照本教程中共享的说明,您已经获得了在 C# 中*将 PDF 转换为 HTML 所需的知识和能力。此功能增强了 PDF 内容的可访问性和可用性,同时确保与各种设备和浏览器的兼容性。在熟练地配置推荐的库并对文件路径进行必要的调整后,将渲染代码合并到您的项目中将成为一个简单且无故障的过程。
我们在上一主题中详细介绍了如何使用 C# 将 DOCX 渲染为 JPG。如果您需要其他帮助,我们建议您阅读我们关于如何使用 C# 将 DOCX 渲染为 JPG的帖子。