GroupDocs Python SDK em resumo

Converta, mescle, compare, assine e remova informações sensíveis de formatos de documentos populares como PDF, Word e Excel usando um único pacote SDK, veja visão geral do produto para mais detalhes.

Illustration total

Combine o poder de vários pacotes GroupDocs em uma única solução pronta para empresas

GroupDocs.Total for Python via .NET une as capacidades de todas as principais APIs GroupDocs—Conversion, Merger, Signature e Comparison—em um kit integrado.

Automatize fluxos de trabalho complexos como converter arquivos Word para PDF, mesclar relatórios, aplicar assinaturas digitais seguras ou comparar versões de contratos — tudo em um único processo.

Essa abordagem unificada economiza tempo, reduz o esforço de desenvolvimento e simplifica a gestão de documentos em toda a sua organização.

Domine a diversidade de formatos de arquivos

Obtenha compatibilidade contínua com mais de 200 tipos de arquivos, incluindo Word, Excel, PDF, PowerPoint, imagens, desenhos CAD e até arquivos de e‑mail ou código. GroupDocs.Total garante que suas soluções funcionem perfeitamente em praticamente qualquer formato usado em ambientes corporativos.

Multiplataforma e escalável por design

Implante com confiança em Windows, Linux ou macOS — onde quer que o Python seja executado. A arquitetura baseada em .NET do GroupDocs.Total oferece alto desempenho e escalabilidade para cargas de trabalho empresariais, seja em ambientes on‑premises, em contêineres ou na nuvem.

Independência de plataforma

GroupDocs.Total for Python via .NET suporta os seguintes sistemas operacionais, frameworks e gerenciadores de pacotes, veja requisitos do sistema para mais detalhes.

Amazon
Docker
Azure
VS Code
Eclipse
macOS
Linux
PyPI

Formatos de arquivo suportados

GroupDocs.Total for Python via .NET suporta operações com os seguintes formatos de arquivo.

Microsoft Office, OpenDocument e formatos de texto

  • Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM, RTF, TXT
  • Excel: XLS, XLSX, XLSM, XLSB, XLTM, XLT, XLTM, XLTX
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM
  • Project: MPP, MPT, MPX
  • Outlook: MSG, EML, EMLX, PST, OST
  • OneNote: ONE
  • OpenDocument: ODT, OTT, ODS, ODP, OTP, OTS, ODG
  • Fixed Page Layout: PDF, TEX, XPS, OXPS
  • e-Books: EPUB, MOBI, DjVu
  • Delimiter-Separated Values: CSV, TSV

Imagens, gráficos e diagramas

  • Imagens rasterizadas: BMP, GIF, JPG, PNG, TIFF, WebP, DNG, DIB, Jpeg2000 family
  • Windows Icon: ICO
  • Scalable Vector Graphics: SVG, CDR, CMX, IGS, SVGZ
  • Adobe Photoshop: PSD, PSB
  • Stereo Lithography (3D Printing): STL
  • Medical Imaging: DICOM
  • Plotter Documents: PLT, HPG
  • Autodesk Design Web Formats: DWF, DWG
  • AutoCAD Drawing: DWT, IFC, STL, CF2

Outro

  • Rede: HTML, MHT, MHTML, XML
  • Metafile: WMF, EMF, CGM, EMZ, WMZ
  • Visio: VSD, VDX, VSS, VSSX, VSX, VST, VSTX, VTX, VSDX, VDW, VSTM, VSSM, VSDM
  • Project: MPP, MPT, MPX
  • PostScript: PS, EPS
  • Arquivos: ZIP, TAR, BZ2, GZ, RAR, RAR5
  • Outro: VCF, VCARD, NUMBERS, NSF, OBJ
  • C/C++/C# Files: C, CC, C# , CPP, CXX, CS, H, HH, M, MM
  • Java/JavaScript Files: JAVA, JS, JSON, PROPERTIES

Principais recursos

Processamento abrangente de documentos — visualizar, converter, comparar e gerenciar PDFs e arquivos Office em escala. Consulte o guia de início rápido para aprender como integrá‑lo em suas aplicações.

Feature icon

Conversão de formatos

Conversão de alta fidelidade entre centenas de tipos de arquivos com preservação de layout, fontes e metadados. Suporta fluxos de trabalho em lote, streaming e lado‑servidor para sistemas de produção.

Feature icon

Visualização segura de arquivos

Renderização de alta qualidade para 180+ formatos em HTML, PDF, PNG e JPEG. Componentes de visualização incorporáveis para web e desktop com controles de acesso configuráveis e paginação.

Feature icon

Comparação de conteúdo

Comparação precisa lado a lado e inline que destaca alterações de conteúdo, formatação e layout e gera relatórios de mudanças acionáveis para revisão e auditoria.

Feature icon

Controle de marca d’água

Marcação de água programática e extração com suporte a carimbos de texto/imagem, regras de aplicação condicionais e registro de auditoria para conformidade.

Feature icon

Gerenciamento de metadados

Leitura/escrita robusta e normalização de metadados entre formatos, com operações em lote e fluxos de trabalho orientados por políticas para melhorar a capacidade de busca e a governança.

Feature icon

Mesclador de documentos

Mescle vários documentos (tipos mistos suportados) em uma única saída pesquisável com ordenação a nível de página, resolução de conflitos e opções de formato de saída.

Feature icon

Geração baseada em modelo

Criação automática de documentos a partir de modelos e dados externos (JSON, XML, bancos de dados), permitindo relatórios repetíveis e auditáveis e documentos personalizados em escala.

Feature icon

Redação de texto

Redação precisa e irreversível usando regex, correspondência difusa e detecção consciente de sinônimos. Suporta tanto a redação visual quanto a remoção dos dados subjacentes do documento.

Feature icon

Flexibilidade de assinatura

Suporte a assinaturas eletrônicas e digitais (PKI), carimbos de imagem/texto e fluxos de trabalho de verificação — integrável a pipelines de assinatura e trilhas de auditoria.

Fluxos de Trabalho de Documentos Reais

Cenários práticos que demonstram como usar o GroupDocs em fluxos de trabalho de documentos do dia a dia.

Mesclar dois arquivos DOCX e converter o DOCX mesclado para PDF

Necessidade de negócios: Combine vários documentos de origem em uma única entrega portátil (por exemplo: formulários de captura, aprovações ou montagem de seções de contrato) e produza um PDF final para distribuição ou arquivamento.

Produtos usados: GroupDocs.Merger + GroupDocs.Conversion

Resultado: Produz um único PDF pronto para impressão e arquivamento com layout e metadados preservados — reduzindo a montagem manual, simplificando a revisão e garantindo saída consistente para sistemas downstream.

Python

import os
from groupdocs.merger import License as MergerLicense, Merger
from groupdocs.conversion import License as ConversionLicense, Converter
from groupdocs.conversion.options.convert import PdfConvertOptions, PdfFormats

# Aplicar licença
license_path = os.path.abspath("./GroupDocs.Total.lic")
if os.path.exists(license_path):
    merger_license = MergerLicense()
    merger_license.set_license(license_path)

    conversion_license = ConversionLicense()
    conversion_license.set_license(license_path)

# Mesclar dois arquivos DOCX em um único documento
with Merger("./part-a.docx") as merger:
    merger.join("./part-b.docx")
    merger.save("./output-merged.docx")

# Converter o DOCX mesclado para PDF (PDF/A-2b para conformidade de arquivamento)
with Converter("./output-merged.docx") as converter:
    options = PdfConvertOptions()
    options.pdf_options.pdf_format = PdfFormats.PDF_A_2B
    converter.convert("./final-delivery.pdf", options)

Extrair texto, miniaturas e metadados para indexação

Necessidade de negócios: Extrair automaticamente texto pesquisável, pré-visualizações visuais e metadados estruturados de documentos ingeridos para alimentar busca, pré-visualizações e classificação de conteúdo em um índice corporativo.

Produtos usados: GroupDocs.Viewer + GroupDocs.Metadata

Resultado: Permite descoberta de documentos mais rápida e uma experiência de busca mais rica (texto + miniatura + metadados), melhora a relevância e automatiza fluxos de trabalho downstream, como marcação, roteamento ou classificação baseada em ML.

Python

import os
from groupdocs.viewer import License as ViewerLicense, Viewer
from groupdocs.viewer.options import HtmlViewOptions
from groupdocs.metadata import License as MetadataLicense, Metadata
from groupdocs.metadata.search import AnySpecification

# Aplicar licença
license_path = os.path.abspath("./GroupDocs.Total.lic")

if os.path.exists(license_path):
    viewer_license = ViewerLicense()
    viewer_license.set_license(license_path)

    metadata_license = MetadataLicense()
    metadata_license.set_license(license_path)

# Renderizar a primeira página para HTML (ou imagem) para pré‑visualização/miniatura
with Viewer("bussiness-plan.docx") as viewer:
    view_options = HtmlViewOptions.for_embedded_resources()
    viewer.view(view_options, [1]) 

# Ler metadados (título, autor, propriedades personalizadas)
with Metadata("bussiness-plan.docx") as metadata:
   props = metadata.find_properties(AnySpecification())
   for prop in props:
       print(prop.name, prop.value)

Compare duas versões de uma proposta comercial, gere um relatório de alterações e redacte informações pessoais

Necessidade de negócio: Propostas comerciais costumam passar por múltiplas revisões. É importante identificar rapidamente o que mudou e remover detalhes de contato sensíveis, como nomes, e‑mails ou números de telefone, antes de compartilhar o documento externamente.

Produtos usados: GroupDocs.Comparison + GroupDocs.Redaction

Resultado: O resultado é um relatório de alterações claro, destacando todas as edições entre as versões da proposta, com as informações de contato redigidas de forma segura para distribuição segura e em conformidade.

Python

import os
from groupdocs.comparison import License as ComparisonLicense, Comparer
from groupdocs.redaction import License as RedactionLicense, Redactor
from groupdocs.redaction.options import SaveOptions
from groupdocs.redaction.redactions import ReplacementOptions, RegexRedaction

# Aplicar licença
license_path = os.path.abspath("./GroupDocs.Total.lic")

if os.path.exists(license_path):
    comparison_license = ComparisonLicense()
    comparison_license.set_license(license_path)

    redaction_license = RedactionLicense()
    redaction_license.set_license(license_path)

# Compare duas versões do documento
with Comparer("./proposal_v1.docx") as comparer:
    comparer.add("./proposal_v2.docx")
    comparer.compare("./proposal_diffs.docx")

# Defina padrões para redactar informações pessoais e da empresa
replacement_options = ReplacementOptions("[REDACTED]")
phone_pattern = r"\b(?:\+?1[-.\s]?)?(?:\(?\d{3}\)?[-.\s]?)\d{3}[-.\s]?\d{4}\b"
email_pattern = r"[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}"

# Defina as redações a aplicar
redactions = [
    RegexRedaction(email_pattern, replacement_options),
    RegexRedaction(phone_pattern, replacement_options),
]

# Aplique as redações ao documento
with Redactor("./proposal_diffs.docx") as redactor:
    for redaction in redactions:
        redactor.apply(redaction)

    # Defina opções de salvamento para manter o formato original do arquivo
    save_options = SaveOptions()
    save_options.add_suffix = True
    save_options.rasterize_to_pdf = False
    save_options.redacted_file_suffix = "redacted"

    # Salve o documento redigido
    redactor.save(save_options)

Pronto para começar?

Baixe GroupDocs.Total gratuitamente ou obtenha uma licença de teste para acesso total!

Recursos úteis

Explore a documentação, as amostras de código e o apoio da comunidade para aprimorar sua experiência.

Dicas de licença temporária

1
Cadastre-se com seu e-mail comercial. Serviços de e-mail gratuitos não são permitidos.
2
Use o botão Obter uma licença temporária na segunda etapa.
 Português