使用 C# 从 DOCX 中删除元数据

在当今的数字时代,电子文档中存储的信息通常超出了可见内容的范围。元数据或有关数据的数据可以包括作者信息、创建日期、编辑历史记录等详细信息。虽然元数据有多种用途,但在某些情况下,出于隐私、安全或合规性原因,您可能需要将其从 DOCX 文件中删除。在本文中,我们将探讨如何使用 C# 从 DOCX 中删除元数据,并提供分步指南和对该过程的见解。以下步骤展示了如何从 C# 中的 DOCX 中清理元数据**。

使用 C# 从 DOCX 中删除元数据的步骤

  1. 配置您的编码环境以利用 GroupDocs.Redaction for .NET 从 DOCX 文件中删除元数据
  2. 通过将 DOCX 的文件路径作为参数提供给其构造函数来实例化 Redactor
  3. 创建一个 EraseMetadataRedaction 对象并使用 Redactor.Apply 方法应用它以从 DOCX 文件中删除元数据
  4. 使用 Redactor.Save 方法将修改后的 DOCX 文件保存到磁盘

DOCX 是一种通常与 Microsoft Word 文档相关的文件格式,它可能存储在文字处理器中查看时在文档中无法立即看到的元数据。此元数据可以包含作者信息(例如姓名、电子邮件地址和组织)、创建和修改日期、文档属性和修订历史记录(包括跟踪更改、评论和注释)等详细信息。在需要共享文档而不泄露敏感信息或确保遵守隐私法规的情况下,删除元数据至关重要。以下是从 DOCX* 删除元数据的示例 *C# 代码。

使用 C# 从 DOCX 中删除元数据的代码

using GroupDocs.Redaction.Options;
using GroupDocs.Redaction.Redactions;
namespace GroupDocs.Redaction
{
internal class RemoveMetadatafromDOCXusingCSharp
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Redaction library
License lic = new License();
lic.SetLicense(@"GroupDocs.Redaction.lic");
// Control document redaction process, allowing to open,
// redact and save documents
using (Redactor redactor = new Redactor(@"input.docx"))
{
// Erase Author, Manager and Company
// redactor.Apply(new EraseMetadataRedaction(MetadataFilters.Author
// | MetadataFilters.Manager | MetadataFilters.Company));
// Erase all metadata
redactor.Apply(new EraseMetadataRedaction(MetadataFilters.All));
redactor.Save(new SaveOptions()
{
AddSuffix = true,
RasterizeToPDF = false
});
}
}
}
}

从 DOCX 文件中删除元数据提供了一种在共享或发布文档之前清理文档的简单有效的方法。通过遵循本指南中概述的步骤,您可以自动执行元数据删除过程、增强文档隐私并轻松满足合规性要求。如果您的系统上存在 .NET,您可以轻松地在 Windows、macOS 或 Linux 计算机上执行概述的步骤。无需安装额外的软件即可*使用 C# 清除 DOCX 中的文档属性。配置推荐的库并根据需要修改文件路径后,您可以顺利地将提供的代码示例合并到您的项目中,而不会遇到任何挑战或障碍。

在我们之前的对话中,我们提供了有关如何使用 C# 编辑 RTF 文件中的文本的详细指南。为了更深入地了解,我们建议查阅我们关于如何使用 C# 编辑 RTF 文本的详细教程。

 简体中文