GroupDocs.Metadata 概览

用于控制元数据的 Python 库

Illustration metadata

主要特点

GroupDocs.Metadata for Python via .NET 是一个功能强大的库,用于管理各种文件格式的元数据。在您的 Python 应用中集成查看、编辑、删除、搜索、比较、替换和导出元数据。支持流行的格式,如 PDF、Microsoft Office(Word、Excel、PowerPoint)、Outlook 电子邮件、Project、Visio 图表、OneNote、图像(PSD、CAD)、音频、视频、OpenType 字体和图元文件。

轻松的元数据操作

我们的库提供元数据搜索、替换、属性比较和提取等功能。将元数据导出为 Excel、CSV 或 DataSet 格式。支持内置、XMP、EXIF 和自定义属性等元数据标准。

热门平台支持

GroupDocs.Metadata for Python via .NET 与流行的 Python 版本兼容,并在 Windows、Linux 和 macOS 上运行。

平台独立性

GroupDocs.Metadata for Python via .NET 已准备好与各种操作系统和包管理器集成。

Amazon
Docker
Azure
Eclipse
IntelliJ
Windows
Linux
PyPI

支持的文件格式

GroupDocs.Metadata for Python via .NET 可处理多种文件格式。 探索完整列表

办公格式

  • 便携的: PDF
  • Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM, RTF, TXT
  • Excel: XLS, XLSX, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM
  • OpenDocument: ODT, ODS
  • Visio: VSD, VDX, VSS, VSSX, VSX, VST, VSTX, VTX, VSDX, VDW, VSTM, VSSM, VSDM

媒体与图形

  • 视频: AVI, MOV, QT, FLV
  • 流行的图像格式: JPG, JPEG, JPE, JP2, PNG, BMP
  • 多页图像: GIF, WEBP, TIFF, DJVU, DJV, DICOM
  • 声音的: MP3, WAV
  • Matroska Media Container: MKV, MKA, MK3D, WEBM
  • AutoCAD: DWG, DXF
  • Photoshop: PSD

其他

  • Outlook: MSG, EML, EMLX, PST, OS
  • 字体: OTF, OTC, TTF, TTC
  • 项目: MPP
  • Metafiles: EMF, WMF
  • vCard: VCF, VCR
  • OneNote: ONE
  • 其他的: EPUB, ZIP, TORRENT, ASF

GroupDocs.Metadata for Python via .NET 功能

通过元数据处理增强文档安全性。

Feature icon

保护商业文件

从业务报告和文档中删除元数据和评论

Feature icon

照片地点

管理图像元数据,包括照片位置信息

Feature icon

控制办公室文件

操作 PDF、Word、Excel、PowerPoint 和其他格式的元数据

Feature icon

分析元数据变化

比较和分析支持的文件格式的元数据更改

Feature icon

内置元数据支持

使用内置和自定义元数据属性

Feature icon

控制图像元数据

收集图像文件元数据,例如 EXIF 或 XMP

Feature icon

电子邮件元数据支持

管理电子邮件中的元数据和附件

Feature icon

EXIF 图像元数据

编辑 WEBP、PNG 或 PSD 文件中的 EXIF 元数据

Feature icon

优化文件内容

减少 PDF、Excel 和图像文件的内存使用量

Feature icon

Matroska 多媒体支持

获取音频和视频文件中的 Matroska 字幕和元数据

Feature icon

生成图像预览

创建 MSG、CAD、EML 或 EPUB 图像格式的预览

Feature icon

多媒体支持

从 MOV、MP3 和 WEBP 文件中检索 XMP 元数据

Feature icon

控制数字签名

识别并删除 PDF 和 Office 文档中的数字签名

Feature icon

元数据导出

将元数据导出为 Excel、CSV 或 DataSet 格式

Feature icon

内置元数据控制

使用定义的键分析特定的元数据属性

Feature icon

密码保护

检测 PDF 和 MS Word、Excel 和 PowerPoint 文档中的密码保护

Feature icon

替换元数据内容

替换 Word、Excel、PowerPoint 和 PDF 文件中的元数据属性

Feature icon

PNG 元数据导出

使用 Python 从 PNG 图像中提取文本元数据

Feature icon

更新图像元数据

使用搜索 API 添加或更新 XMP 和 EXIF 元数据

Feature icon

控制办公文件

访问和删除 PDF、MS Word、Excel 和 PowerPoint 文件中的隐藏数据

Feature icon

文件类型检测

使用 Python 在运行时检测文件类型

Feature icon

Matroska 多媒体预览

检索具有 Matroska 支持的文件的缩略图和图像预览

Feature icon

TIFF 支持

操作 TIFF 图像中的 IPTC 元数据

Feature icon

HEIC 媒体支持

管理 HEIC/HEIF 图像中的 EXIF 标签和 XMP 元数据

Feature icon

字体元数据支持

控制 OpenType 字体文件中的元数据

Feature icon

微软项目支持

从加密的 Microsoft Project 文件中检索元数据

Feature icon

JPEG 元数据支持

添加、更新或删除 JPEG2000 图像的 EXIF 数据

代码示例

探索演示常见 GroupDocs.Metadata for Python via .NET 功能的代码示例

深入了解文档元数据

使用 GroupDocs.Metadata for Python via .NET API 检索内部文档元数据

如何获取特定文档元数据


import groupdocs.metadata as gm
                
# 将源文档加载到元数据构造函数
with gm.Metadata("input.pptx") as metadata:

    # 获取包含最后一个文档编辑者名称的所有属性
    # 或文档最后修改的日期/时间
    specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.person.editor)
        .either(gm.search.ContainsTagSpecification(gm.tagging.Tags.time.modified))
        
    properties = metadata.find_properties(specification)

    # 处理检索到的元数据条目
    for property in properties:
        print(f"Property name: {property.name}, Property value: {property.value}")

隐藏文档中的业务信息

使用我们的解决方案将元数据添加元数据 到您的文档中:

如何将一些缺失的元数据属性添加到文件中,无论其格式如何。


import groupdocs.metadata as gm

# 加载源文档
with gm.Metadata("input.pdf") as metadata:
    if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:

        # 添加包含文件上次打印日期的属性(如果丢失)
        # 如果文档支持此类元数据,将添加属性
        specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.time.printed)
        now = datetime.now()
        property_value = gm.common.PropertyValue(now)
        affected = metadata.add_properties(specification, property_value)

        # 将修改后的文档保存到指定路径
        print(f"Affected properties: {affected}");
        metadata.save("output.pdf")

临时许可提示

1
使用您的工作电子邮件地址进行注册。不允许使用免费邮件服务。
2
使用第二步中的获取临时许可证按钮。
 中国人