编辑是指从电子文档中删除不需要或机密的信息。所有文件格式,包括 PDF、DOC、DOCX、PPT、PPTX、XLS、XLSX 等,都有一些元数据属性。这些属性包括作者姓名、类别、公司名称、评论、创建时间、上次更新等等。有时您需要完全删除不需要的元数据字段,或者可能需要更新它们的值。还有一些与文件相关的隐藏数据,可以使用各种工具和技术进行查看。在很多情况下,您不希望任何人访问这些数据。使用 GroupDocs.Redaction API,您可以对这些元数据属性中的任何一个应用元数据编辑。您可以通过筛选所需的元数据来更改或删除它们。在本指南中,我们将解释如何从 Java 中的 RTF 元数据中编辑作者姓名。
以下代码允许您搜索和编辑 RTF 文档中的敏感数据。你可以通过设置过滤器来设置编辑范围,例如设置为 metadataFilter.Author。它将撤消所有元数据项中的正则表达式匹配项,但 “Author” 属性除外:
您可以使用 eraseMetadataredAction 类将文档中的所有元数据或特定元数据替换为空(空白或最小)值。以下代码显示了如何筛选然后从 RTF 文档中删除元数据属性。以下示例将该文档的所有属性都清空:
final Redactor redactor = new Redactor(filePath); | |
try | |
{ | |
redactor.apply(new EraseMetadataRedaction(MetadataFilters.All)); | |
SaveOptions options = new SaveOptions(); | |
options.setAddSuffix(true); | |
options.setRasterizeToPDF(false); | |
// Save the document to "*_Redacted.*" file in original format | |
redactor.save(options); | |
} | |
finally { redactor.close(); } |
GroupDocs.Redaction for Java API 在所有主要平台和操作系统上都支持。要获取完整的系统需求指南,请访问 系统要求 在执行以下代码之前,请确保在系统上安装了以下必备组件:
(Bitmap Image File)
(Microsoft Word Binary Format)
(Microsoft Word 2007 Marco File)
(Office 2007+ Word Document)
(Microsoft Word Template Files)
(Microsoft Word 2007+ Template File)
(Microsoft Word Template File )
(Graphical Interchange Format)
(Joint Photographic Expert Group Image)
(Portable Document Format)
(Portable Network Graphic)
(Microsoft PowerPoint Template Files)
(Microsoft PowerPoint Template File)
(PowerPoint Slide Show)
(Macro-enabled Slide Show)
(PowerPoint Slide Show)
(Microsoft PowerPoint 97-2003)
(Macro-enabled Presentation File)
(Open XML presentation Format)
(Tagged Image File Format)
(Microsoft Excel Spreadsheet (Legacy))
(Macro-enabled Spreadsheet)
(Open XML Workbook)
(Excel 97 - 2003 Template)
(Excel Macro-Enabled Template)
(Excel Template)