GroupDocs Python SDK の概要

PDF、Word、Excel などの一般的なドキュメント形式を 1 つの SDK パッケージで変換、結合、比較、署名、赤線処理できます。詳細は 製品概要 をご覧ください。

Illustration total

複数の GroupDocs パッケージの機能を組み合わせ、単一のエンタープライズ向けソリューションに統合する

GroupDocs.Total for Python via .NET は、Conversion、Merger、Signature、Comparison といった主要な GroupDocs API の機能を 1 つの統合ツールキットにまとめます。

Word ファイルを PDF に変換したり、レポートを結合したり、セキュアなデジタル署名を適用したり、契約バージョンを比較したりといった複雑なワークフローを単一のプロセスで自動化します。

この統合アプローチにより、時間の節約、開発工数の削減、組織全体のドキュメント管理の効率化が実現します。

多様なファイル形式に対応する

Word、Excel、PDF、PowerPoint、画像、CAD 図面、さらにメールやコードファイルを含む 200 種類以上のファイル形式とシームレスに互換性を持ちます。GroupDocs.Total は、ビジネス環境で使用されるほぼすべての形式でソリューションが確実に動作することを保証します。

設計上のクロスプラットフォームとスケーラビリティ

Windows、Linux、macOS など、Python が動作する環境ならどこでも自信を持ってデプロイできます。GroupDocs.Total の .NET ベース アーキテクチャは、オンプレミス、コンテナ、クラウドいずれの環境でもエンタープライズ負荷に対し高性能とスケーラビリティを提供します。

プラットフォーム独立性

GroupDocs.Total for Python via .NET は以下のオペレーティングシステム、フレームワーク、パッケージマネージャーをサポートします。詳細は システム要件 をご覧ください。

Amazon
Docker
Azure
VS Code
Eclipse
macOS
Linux
PyPI

サポートされているファイル形式

GroupDocs.Total for Python via .NET は以下の ファイル形式 に対する操作をサポートします。

Microsoft Office、OpenDocument、およびテキスト形式

  • Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM, RTF, TXT
  • Excel: XLS, XLSX, XLSM, XLSB, XLTM, XLT, XLTM, XLTX
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM
  • Project: MPP, MPT, MPX
  • Outlook: MSG, EML, EMLX, PST, OST
  • OneNote: ONE
  • OpenDocument: ODT, OTT, ODS, ODP, OTP, OTS, ODG
  • Fixed Page Layout: PDF, TEX, XPS, OXPS
  • e-Books: EPUB, MOBI, DjVu
  • Delimiter-Separated Values: CSV, TSV

画像、グラフィック、図表

  • ラスター画像: BMP, GIF, JPG, PNG, TIFF, WebP, DNG, DIB, Jpeg2000 family
  • Windows Icon: ICO
  • Scalable Vector Graphics: SVG, CDR, CMX, IGS, SVGZ
  • Adobe Photoshop: PSD, PSB
  • Stereo Lithography (3D Printing): STL
  • Medical Imaging: DICOM
  • Plotter Documents: PLT, HPG
  • Autodesk Design Web Formats: DWF, DWG
  • AutoCAD Drawing: DWT, IFC, STL, CF2

他の

  • ウェブ: HTML, MHT, MHTML, XML
  • Metafile: WMF, EMF, CGM, EMZ, WMZ
  • Visio: VSD, VDX, VSS, VSSX, VSX, VST, VSTX, VTX, VSDX, VDW, VSTM, VSSM, VSDM
  • Project: MPP, MPT, MPX
  • PostScript: PS, EPS
  • アーカイブ: ZIP, TAR, BZ2, GZ, RAR, RAR5
  • 他の: VCF, VCARD, NUMBERS, NSF, OBJ
  • C/C++/C# Files: C, CC, C# , CPP, CXX, CS, H, HH, M, MM
  • Java/JavaScript Files: JAVA, JS, JSON, PROPERTIES

主な機能

包括的なドキュメント処理 — 大規模に PDF や Office ファイルの表示、変換、比較、管理が可能です。クイックスタートガイド をチェックして、アプリケーションへの統合方法を学んでください。

Feature icon

フォーマット変換

レイアウト、フォント、メタデータを保持したまま、数百のファイル形式に対して高忠実度の変換を実現します。バッチ、ストリーミング、サーバーサイドのワークフローをサポートし、プロダクションシステムで利用できます。

Feature icon

安全なファイル閲覧

180 以上のフォーマットへの高品質レンダリングを HTML、PDF、PNG、JPEG に対応。Web とデスクトップ向けに埋め込み可能なビューア コンポーネントを提供し、アクセス制御とページングを構成可能です。

Feature icon

コンテンツ比較

コンテンツ、書式、レイアウトの変更をハイライトし、レビューと監査のための実用的な変更レポートを生成する、正確なサイドバイサイドおよびインライン比較。

Feature icon

透かしコントロール

テキスト/画像スタンプ、条件付き適用ルール、コンプライアンスのための監査ログをサポートした、プログラムによる透かし付与と抽出。

Feature icon

メタデータ管理

フォーマット横断的なメタデータの堅牢な読み書きと正規化を提供し、バルク操作とポリシー主導のワークフローにより検索性とガバナンスを向上させます。

Feature icon

文書マージ

複数の文書(混在タイプ対応)を単一の検索可能な出力に結合し、ページ単位の順序付け、競合解決、出力フォーマットオプションを提供します。

Feature icon

テンプレートベースの生成

テンプレートと外部データ(JSON、XML、データベース)から自動的に文書を作成し、繰り返し可能で監査可能なレポートや大規模なパーソナライズ文書を実現します。

Feature icon

テキストのレダクション

正規表現、あいまい検索、同義語認識による正確で不可逆なレダクションを実現。視覚的なレダクションと文書データからの削除の両方をサポートします。

Feature icon

署名の柔軟性

電子署名とデジタル署名(PKI)、画像/テキストスタンプ、検証ワークフローをサポートし、署名パイプラインや監査トレイルに組み込むことが可能です。

実践的な文書ワークフロー

日常的な文書ワークフローで GroupDocs を使用する方法を示す実践的なシナリオ。

2つの DOCX ファイルをマージし、マージされた DOCX を PDF に変換

ビジネス要件: 複数のソース文書を単一のポータブルな配布物に結合し(例:入力フォーム、承認、契約書セクションの組み立て)、配布またはアーカイブ用の最終 PDF を生成します。

使用製品: GroupDocs.Merger + GroupDocs.Conversion

成果: レイアウトとメタデータを保持した、印刷可能でアーカイブ可能な単一の PDF を生成し、手動での組み立てを削減、レビューを簡素化し、下流システム向けに一貫した出力を保証します。

Python

import os
from groupdocs.merger import License as MergerLicense, Merger
from groupdocs.conversion import License as ConversionLicense, Converter
from groupdocs.conversion.options.convert import PdfConvertOptions, PdfFormats

# ライセンスを適用
license_path = os.path.abspath("./GroupDocs.Total.lic")
if os.path.exists(license_path):
    merger_license = MergerLicense()
    merger_license.set_license(license_path)

    conversion_license = ConversionLicense()
    conversion_license.set_license(license_path)

# 2つの DOCX ファイルを単一の文書にマージ
with Merger("./part-a.docx") as merger:
    merger.join("./part-b.docx")
    merger.save("./output-merged.docx")

# マージされた DOCX を PDF に変換 (PDF/A-2b アーカイブ準拠)
with Converter("./output-merged.docx") as converter:
    options = PdfConvertOptions()
    options.pdf_options.pdf_format = PdfFormats.PDF_A_2B
    converter.convert("./final-delivery.pdf", options)

インデックス作成のためにテキスト、サムネイル、メタデータを抽出

ビジネス要件: 取り込んだ文書から検索可能なテキスト、ビジュアルプレビュー、構造化メタデータを自動的に抽出し、エンタープライズインデックスでの検索、プレビュー、コンテンツ分類を支援します。

使用した製品: GroupDocs.Viewer + GroupDocs.Metadata

結果: ドキュメントの検索を高速化し、テキスト・サムネイル・メタデータを組み合わせたリッチな検索 UX を実現し、関連性を向上させ、タグ付け、ルーティング、機械学習ベースの分類などの下流ワークフローを自動化します。

Python

import os
from groupdocs.viewer import License as ViewerLicense, Viewer
from groupdocs.viewer.options import HtmlViewOptions
from groupdocs.metadata import License as MetadataLicense, Metadata
from groupdocs.metadata.search import AnySpecification

# ライセンスを適用する
license_path = os.path.abspath("./GroupDocs.Total.lic")

if os.path.exists(license_path):
    viewer_license = ViewerLicense()
    viewer_license.set_license(license_path)

    metadata_license = MetadataLicense()
    metadata_license.set_license(license_path)

# プレビュー/サムネイル用に最初のページを HTML(または画像)にレンダリングする
with Viewer("bussiness-plan.docx") as viewer:
    view_options = HtmlViewOptions.for_embedded_resources()
    viewer.view(view_options, [1]) 

# メタデータ(タイトル、作成者、カスタムプロパティ)を読み取る
with Metadata("bussiness-plan.docx") as metadata:
   props = metadata.find_properties(AnySpecification())
   for prop in props:
       print(prop.name, prop.value)

ビジネス提案書の 2 つのバージョンを比較し、変更レポートを生成し、個人情報をマスクする

ビジネス上の課題: ビジネス提案書はしばしば複数回の改訂を経ます。変更点を迅速に特定し、外部共有前に氏名、メールアドレス、電話番号などの機密連絡先情報を削除することが重要です。

使用した製品: GroupDocs.Comparison + GroupDocs.Redaction

結果: 結果として、提案書バージョン間のすべての編集点を強調する明確な変更レポートが生成され、連絡先情報は安全にマスクされ、安心かつコンプライアンスに適合した配布が可能になります。

Python

import os
from groupdocs.comparison import License as ComparisonLicense, Comparer
from groupdocs.redaction import License as RedactionLicense, Redactor
from groupdocs.redaction.options import SaveOptions
from groupdocs.redaction.redactions import ReplacementOptions, RegexRedaction

# ライセンスを適用する
license_path = os.path.abspath("./GroupDocs.Total.lic")

if os.path.exists(license_path):
    comparison_license = ComparisonLicense()
    comparison_license.set_license(license_path)

    redaction_license = RedactionLicense()
    redaction_license.set_license(license_path)

# ドキュメントの 2 つのバージョンを比較する
with Comparer("./proposal_v1.docx") as comparer:
    comparer.add("./proposal_v2.docx")
    comparer.compare("./proposal_diffs.docx")

# 個人情報および会社情報をマスクするパターンを定義する
replacement_options = ReplacementOptions("[REDACTED]")
phone_pattern = r"\b(?:\+?1[-.\s]?)?(?:\(?\d{3}\)?[-.\s]?)\d{3}[-.\s]?\d{4}\b"
email_pattern = r"[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}"

# 適用するマスク設定を定義する
redactions = [
    RegexRedaction(email_pattern, replacement_options),
    RegexRedaction(phone_pattern, replacement_options),
]

# ドキュメントにマスクを適用する
with Redactor("./proposal_diffs.docx") as redactor:
    for redaction in redactions:
        redactor.apply(redaction)

    # ソースファイル形式を保持する保存オプションを設定する
    save_options = SaveOptions()
    save_options.add_suffix = True
    save_options.rasterize_to_pdf = False
    save_options.redacted_file_suffix = "redacted"

    # マスクされたドキュメントを保存する
    redactor.save(save_options)

始める準備はできていますか?

GroupDocs.Total を無料でダウンロードするか、フルアクセス用の試用版ライセンスを取得してください。

有用なリソース

ドキュメント、コードサンプル、コミュニティサポートを調べて、体験を向上させます。

一時ライセンスのヒント

1
職場の電子メールで登録してください。フリー メール サービスは使用できません。
2
2 番目のステップで [一時ライセンスを取得] ボタンを使用します。
 日本