GroupDocs.Markdown 概览

用于将文档导出为干净、结构化 Markdown 的 Python API。

Illustration markdown

准确可靠的转换

高效地将支持的格式转换为 Markdown,同时保持结构完整性。适用于 Windows、Linux 和 macOS,支持 Python 3.5+。

支持的流行格式

将 PDF、Word、Excel、电子书、Web 和纯文本文件导出为 Markdown,包括受密码保护的文档。

在本地机器上运行

您掌控数据——本地部署 API,无需任何云或互联网连接。

平台支持

支持以下操作系统和包管理器。

Amazon
Docker
Azure
Eclipse
IntelliJ
Windows
Linux
PyPI

支持的文件格式

以下文件格式支持导出为 Markdown。

PDF

  • Digital PDFs, PDF/A, PDF/E, PDF/X and PDF/UA
  • Encrypted and Signed PDFs

Word 与 Excel

  • Word: DOCX, DOC, RTF, DOCM, DOTX, DOTM, DOT, ODT, OTT
  • Excel: XLSX, XLS, CSV, XLSM, XLSB, ODS, TSV, NUMBERS, XLTX, XLTM, XLAM, FODS, SXC, OTS, XLT

其他

  • e-Books: EPUB, MOBI, AZW3
  • Text: TXT, XML
  • Web: CHM

GroupDocs.Markdown 功能

以下是使我们的产品脱颖而出的功能。

Feature icon

导出多种文档格式

将最流行的文档格式(PDF、DOCX、XLSX、EPUB 等)转换为 Markdown。

Feature icon

高级 Markdown 格式化

标题、段落、列表、表格、链接、图像、块引用和代码块均导出为相应的 Markdown 语法。

Feature icon

对图像的完全控制

通过导出图像或将其嵌入输出的 Markdown 文件来控制图像。

Feature icon

在本地机器上运行

无需云服务或互联网连接。所有处理均在本地机器上完成。

Feature icon

直观的公共 API

由开发者为开发者精心设计的简洁直观的公共 API。

Feature icon

支持 Windows 和 Linux

.NET 和 .NET Framework 程序集已包含在 NuGet 包中。

代码示例

在 Python 中导出文档为 Markdown 的最常见使用场景。

导出 DOCX 为 Markdown

将 Word 文档转换为 Markdown。默认情况下,图像嵌入为 Base64。
# 导入模块
from groupdocs.markdown import MarkdownConverter

# 转换并将输出保存到文件
MarkdownConverter.to_file("annual-review.docx", "annual-review.md")

将图像保存到文件夹

将文档转换为 Markdown,并将图像保存到具有相对路径的单独文件夹。
# 导入模块
from groupdocs.markdown import MarkdownConverter, ConvertOptions
from groupdocs.markdown import ExportImagesToFileSystemStrategy

# 配置图像导出到文件系统
strategy = ExportImagesToFileSystemStrategy("./images")
strategy.images_relative_path = "images"
options = ConvertOptions()
options.image_export_strategy = strategy

# 转换并将输出保存到文件
MarkdownConverter.to_file(
    "annual-report.docx", "annual-report.md",
    convert_options=options)

检查文档并转换特定页面

在转换前获取文档元数据,然后仅导出所需页面。
# 导入模块
from groupdocs.markdown import MarkdownConverter, ConvertOptions

# 检查文档而不转换
info = MarkdownConverter.get_info("report.pdf")
print(f"{info.page_count} pages, by {info.author}")

# 仅将前3页转换并生成 front matter
options = ConvertOptions()
options.page_numbers = [1, 2, 3]
options.include_front_matter = True

# 使用单行静态方法
md = MarkdownConverter.to_markdown("report.pdf",
    convert_options=options)

准备好开始了吗?

免费下载 GroupDocs.Markdown 或获取试用许可证以获得完全访问权限!

有用的资源

探索文档,代码样本和社区支持,以增强您的体验。

临时许可提示

1
使用您的工作电子邮件地址进行注册。不允许使用免费邮件服务。
2
使用第二步中的获取临时许可证按钮。
 中国人