GroupDocs Python SDK tổng quan

Chuyển đổi, hợp nhất, so sánh, ký và tẩy nhãn các định dạng tài liệu phổ biến như PDF, Word và Excel bằng một gói SDK duy nhất, xem tổng quan sản phẩm để biết thêm chi tiết.

Illustration total

Kết hợp sức mạnh của nhiều gói GroupDocs vào một giải pháp sẵn sàng cho doanh nghiệp

GroupDocs.Total cho Python qua .NET gộp các khả năng của tất cả các API chính của GroupDocs — Conversion, Merger, Signature và Comparison — thành một bộ công cụ tích hợp.

Tự động hoá các quy trình công việc phức tạp như chuyển đổi tệp Word sang PDF, hợp nhất báo cáo, áp dụng chữ ký số bảo mật, hoặc so sánh các phiên bản hợp đồng — tất cả trong một quy trình duy nhất.

Cách tiếp cận thống nhất này giúp tiết kiệm thời gian, giảm công sức phát triển và tối ưu hoá quản lý tài liệu trên toàn tổ chức của bạn.

Làm chủ đa dạng các định dạng tệp

Đạt được khả năng tương thích liền mạch với hơn 200 loại tệp, bao gồm Word, Excel, PDF, PowerPoint, hình ảnh, bản vẽ CAD và thậm chí các tệp email hoặc mã nguồn. GroupDocs.Total đảm bảo giải pháp của bạn hoạt động hoàn hảo trên hầu hết mọi định dạng được sử dụng trong môi trường kinh doanh.

Thiết kế đa nền tảng và có khả năng mở rộng

Triển khai tự tin trên Windows, Linux hoặc macOS — bất kỳ nơi nào Python chạy. Kiến trúc dựa trên .NET của GroupDocs.Total mang lại hiệu năng cao và khả năng mở rộng cho tải công việc doanh nghiệp, dù chạy trên máy chủ nội bộ, trong container hay trên đám mây.

Tính độc lập nền tảng

GroupDocs.Total cho Python qua .NET hỗ trợ các hệ điều hành, framework và trình quản lý gói sau, xem yêu cầu hệ thống để biết thêm chi tiết.

Amazon
Docker
Azure
VS Code
Eclipse
macOS
Linux
PyPI

Các định dạng tập tin được hỗ trợ

GroupDocs.Total cho Python qua .NET hỗ trợ các thao tác với các định dạng tệp sau.

Microsoft Office, OpenDocument và các định dạng văn bản

  • Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM, RTF, TXT
  • Excel: XLS, XLSX, XLSM, XLSB, XLTM, XLT, XLTM, XLTX
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM
  • Project: MPP, MPT, MPX
  • Outlook: MSG, EML, EMLX, PST, OST
  • OneNote: ONE
  • OpenDocument: ODT, OTT, ODS, ODP, OTP, OTS, ODG
  • Fixed Page Layout: PDF, TEX, XPS, OXPS
  • e-Books: EPUB, MOBI, DjVu
  • Delimiter-Separated Values: CSV, TSV

Hình ảnh, Đồ họa & Sơ đồ

  • Hình ảnh raster: BMP, GIF, JPG, PNG, TIFF, WebP, DNG, DIB, Jpeg2000 family
  • Windows Icon: ICO
  • Scalable Vector Graphics: SVG, CDR, CMX, IGS, SVGZ
  • Adobe Photoshop: PSD, PSB
  • Stereo Lithography (3D Printing): STL
  • Medical Imaging: DICOM
  • Plotter Documents: PLT, HPG
  • Autodesk Design Web Formats: DWF, DWG
  • AutoCAD Drawing: DWT, IFC, STL, CF2

Khác

  • Web: HTML, MHT, MHTML, XML
  • Metafile: WMF, EMF, CGM, EMZ, WMZ
  • Visio: VSD, VDX, VSS, VSSX, VSX, VST, VSTX, VTX, VSDX, VDW, VSTM, VSSM, VSDM
  • Project: MPP, MPT, MPX
  • PostScript: PS, EPS
  • Lưu trữ: ZIP, TAR, BZ2, GZ, RAR, RAR5
  • Khác: VCF, VCARD, NUMBERS, NSF, OBJ
  • C/C++/C# Files: C, CC, C# , CPP, CXX, CS, H, HH, M, MM
  • Java/JavaScript Files: JAVA, JS, JSON, PROPERTIES

Tính năng chính

Xử lý tài liệu toàn diện — xem, chuyển đổi, so sánh và quản lý PDF và tệp Office ở quy mô lớn. Xem hướng dẫn khởi đầu nhanh để biết cách tích hợp nó vào ứng dụng của bạn.

Feature icon

Chuyển đổi định dạng

Chuyển đổi độ chính xác cao trên hàng trăm loại tệp với bố cục, phông chữ và metadata được bảo toàn. Hỗ trợ xử lý hàng loạt, streaming và quy trình phía máy chủ cho hệ thống sản xuất.

Feature icon

Xem tệp an toàn

Kết xuất chất lượng cao cho hơn 180 định dạng sang HTML, PDF, PNG và JPEG. Các thành phần trình xem có thể nhúng cho web và desktop với kiểm soát truy cập có thể cấu hình và phân trang.

Feature icon

So sánh nội dung

So sánh chính xác song song và trong dòng, làm nổi bật các thay đổi về nội dung, định dạng và bố cục, đồng thời tạo ra các báo cáo thay đổi có thể hành động được để xem xét và kiểm toán.

Feature icon

Kiểm soát watermark

Thêm và trích xuất watermark một cách lập trình, hỗ trợ nhãn văn bản/hình ảnh, quy tắc áp dụng có điều kiện và ghi nhật ký kiểm tra để tuân thủ.

Feature icon

Quản lý metadata

Đọc/ghi và chuẩn hoá metadata mạnh mẽ trên các định dạng, với các thao tác hàng loạt và quy trình làm việc dựa trên chính sách để cải thiện khả năng tìm kiếm và quản trị.

Feature icon

Ghép tài liệu

Ghép nhiều tài liệu (hỗ trợ các loại hỗn hợp) thành một đầu ra duy nhất có khả năng tìm kiếm, với sắp xếp theo mức độ trang, giải quyết xung đột và các tùy chọn định dạng đầu ra.

Feature icon

Tạo dựa trên mẫu

Tự động tạo tài liệu từ mẫu và dữ liệu bên ngoài (JSON, XML, cơ sở dữ liệu), cho phép tạo các báo cáo có thể lặp lại, kiểm toán và tài liệu cá nhân hoá ở quy mô lớn.

Feature icon

Che dấu văn bản

Che dấu chính xác, không thể khôi phục bằng cách sử dụng regex, khớp mờ và phát hiện dựa trên đồng nghĩa. Hỗ trợ cả việc che dấu trực quan và loại bỏ dữ liệu gốc của tài liệu.

Feature icon

Linh hoạt ký điện tử

Hỗ trợ chữ ký điện tử và kỹ thuật số (PKI), nhãn hình ảnh/văn bản và quy trình xác thực — có thể tích hợp vào các pipeline ký và chuỗi kiểm tra.

Quy trình tài liệu thực tế

Các kịch bản thực tế minh họa cách sử dụng GroupDocs trong các quy trình tài liệu hàng ngày.

Ghép hai tệp DOCX và chuyển đổi DOCX đã ghép sang PDF

Nhu cầu kinh doanh: Kết hợp nhiều tài liệu nguồn thành một bản giao nhận di động (ví dụ: mẫu đơn nhập, phê duyệt, hoặc lắp ráp các phần hợp đồng) và tạo ra một PDF cuối cùng để phân phối hoặc lưu trữ.

Sản phẩm được sử dụng: GroupDocs.Merger + GroupDocs.Conversion

Kết quả: Tạo ra một PDF duy nhất, sẵn sàng in và lưu trữ với bố cục và metadata được giữ nguyên — giảm việc lắp ráp thủ công, đơn giản hoá quá trình xem xét và đảm bảo đầu ra nhất quán cho các hệ thống downstream.

Python

import os
from groupdocs.merger import License as MergerLicense, Merger
from groupdocs.conversion import License as ConversionLicense, Converter
from groupdocs.conversion.options.convert import PdfConvertOptions, PdfFormats

# Áp dụng giấy phép
license_path = os.path.abspath("./GroupDocs.Total.lic")
if os.path.exists(license_path):
    merger_license = MergerLicense()
    merger_license.set_license(license_path)

    conversion_license = ConversionLicense()
    conversion_license.set_license(license_path)

# Ghép hai tệp DOCX thành một tài liệu duy nhất
with Merger("./part-a.docx") as merger:
    merger.join("./part-b.docx")
    merger.save("./output-merged.docx")

# Chuyển đổi DOCX đã ghép sang PDF (PDF/A-2b để tuân thủ lưu trữ)
with Converter("./output-merged.docx") as converter:
    options = PdfConvertOptions()
    options.pdf_options.pdf_format = PdfFormats.PDF_A_2B
    converter.convert("./final-delivery.pdf", options)

Trích xuất văn bản, hình thu nhỏ và metadata để lập chỉ mục

Nhu cầu kinh doanh: Tự động trích xuất văn bản có thể tìm kiếm, bản xem trước hình ảnh và metadata có cấu trúc từ các tài liệu đã nhập để hỗ trợ tìm kiếm, xem trước và phân loại nội dung trong chỉ mục doanh nghiệp.

Sản phẩm được sử dụng: GroupDocs.Viewer + GroupDocs.Metadata

Kết quả: Cho phép khám phá tài liệu nhanh hơn và trải nghiệm tìm kiếm phong phú hơn (văn bản + ảnh thu nhỏ + siêu dữ liệu), cải thiện độ liên quan và tự động hoá các quy trình downstream như gắn thẻ, định tuyến hoặc phân loại dựa trên ML.

Python

import os
from groupdocs.viewer import License as ViewerLicense, Viewer
from groupdocs.viewer.options import HtmlViewOptions
from groupdocs.metadata import License as MetadataLicense, Metadata
from groupdocs.metadata.search import AnySpecification

# Áp dụng giấy phép
license_path = os.path.abspath("./GroupDocs.Total.lic")

if os.path.exists(license_path):
    viewer_license = ViewerLicense()
    viewer_license.set_license(license_path)

    metadata_license = MetadataLicense()
    metadata_license.set_license(license_path)

# Kết xuất trang đầu tiên sang HTML (hoặc ảnh) để xem trước/ảnh thu nhỏ
with Viewer("bussiness-plan.docx") as viewer:
    view_options = HtmlViewOptions.for_embedded_resources()
    viewer.view(view_options, [1]) 

# Đọc siêu dữ liệu (tiêu đề, tác giả, thuộc tính tùy chỉnh)
with Metadata("bussiness-plan.docx") as metadata:
   props = metadata.find_properties(AnySpecification())
   for prop in props:
       print(prop.name, prop.value)

So sánh hai phiên bản của đề xuất kinh doanh, tạo báo cáo thay đổi và xóa thông tin cá nhân

Nhu cầu kinh doanh: Đề xuất kinh doanh thường trải qua nhiều lần chỉnh sửa. Việc nhanh chóng xác định những thay đổi và loại bỏ các chi tiết liên hệ nhạy cảm như tên, email hoặc số điện thoại trước khi chia sẻ tài liệu ra bên ngoài là rất quan trọng.

Sản phẩm được sử dụng: GroupDocs.Comparison + GroupDocs.Redaction

Kết quả: Kết quả là một báo cáo thay đổi rõ ràng nêu bật mọi chỉnh sửa giữa các phiên bản đề xuất, với thông tin liên hệ được xóa một cách an toàn để phân phối an toàn và tuân thủ.

Python

import os
from groupdocs.comparison import License as ComparisonLicense, Comparer
from groupdocs.redaction import License as RedactionLicense, Redactor
from groupdocs.redaction.options import SaveOptions
from groupdocs.redaction.redactions import ReplacementOptions, RegexRedaction

# Áp dụng giấy phép
license_path = os.path.abspath("./GroupDocs.Total.lic")

if os.path.exists(license_path):
    comparison_license = ComparisonLicense()
    comparison_license.set_license(license_path)

    redaction_license = RedactionLicense()
    redaction_license.set_license(license_path)

# So sánh hai phiên bản của tài liệu
with Comparer("./proposal_v1.docx") as comparer:
    comparer.add("./proposal_v2.docx")
    comparer.compare("./proposal_diffs.docx")

# Xác định mẫu để xóa thông tin cá nhân và công ty
replacement_options = ReplacementOptions("[REDACTED]")
phone_pattern = r"\b(?:\+?1[-.\s]?)?(?:\(?\d{3}\)?[-.\s]?)\d{3}[-.\s]?\d{4}\b"
email_pattern = r"[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}"

# Xác định các phần cần xóa
redactions = [
    RegexRedaction(email_pattern, replacement_options),
    RegexRedaction(phone_pattern, replacement_options),
]

# Áp dụng việc xóa vào tài liệu
with Redactor("./proposal_diffs.docx") as redactor:
    for redaction in redactions:
        redactor.apply(redaction)

    # Đặt tùy chọn lưu để giữ định dạng tệp nguồn
    save_options = SaveOptions()
    save_options.add_suffix = True
    save_options.rasterize_to_pdf = False
    save_options.redacted_file_suffix = "redacted"

    # Lưu tài liệu đã xóa
    redactor.save(save_options)

Sẵn sàng để bắt đầu?

Tải xuống GroupDocs.Total miễn phí hoặc nhận giấy phép dùng thử để có toàn quyền truy cập!

Tài nguyên hữu ích

Khám phá tài liệu, mẫu mã và hỗ trợ cộng đồng để nâng cao trải nghiệm của bạn.

Lời khuyên về giấy phép tạm thời

1
Đăng ký bằng email công việc của bạn. Dịch vụ thư miễn phí không được phép.
2
Sử dụng nút Nhận giấy phép tạm thời ở Bước thứ hai.
 Tiếng Việt