文档转 Markdown 转换 API

在 Python 中将 DOC 导出为 Markdown

在 Python 应用程序中将 DOC 文件转换为结构化的 Markdown。保留标题、列表、表格、链接和图像,并可全面控制图像导出策略。

如何在 Python 中将 DOC 导出为 Markdown

使用 通过 .NET 的 GroupDocs.Markdown for Python,您可以通过几步将 DOC 导出为 Markdown。

  1. 从 PyPI 安装 groupdocs-markdown-netpip install groupdocs-markdown-net
  2. 使用 DOC 文件路径调用 MarkdownConverter.to_markdown(),获取 Markdown 字符串。
  3. 或调用 MarkdownConverter.to_file(),直接将 Markdown 输出保存为文件。
  4. 使用 ConvertOptions 控制图像处理、标题偏移、Front Matter 和 Markdown 语法风格。

# 设置输入 DOC 文件
file_path = "input.doc"

# 转换为 Markdown 字符串
md = MarkdownConverter.to_markdown(file_path)

# 或直接保存为文件
MarkdownConverter.to_file(file_path, "output.md")
pip install groupdocs-markdown-net
点击复制
已复制
更多示例 文档

关于通过 .NET 的 GroupDocs.Markdown for Python

通过 .NET 的 GroupDocs.Markdown for Python 是一款本地部署 API,可将 DOC 以及 30 多种其他文档格式导出为干净、结构化的 Markdown。输出保留文档结构 —— 标题、列表、表格、链接和图像 —— 使其非常适合 AI/LLM 流水线、RAG 系统、静态站点生成器和内容管理工作流。可自行选择图像处理方式:嵌入为 Base64、保存到带相对路径的文件夹、跳过或提供自定义处理器。支持在 Windows、Linux 和 macOS 上运行,要求 Python 3.5+。无需云连接或第三方软件。
了解更多
About illustration

准备好开始了吗?

免费下载 GroupDocs.Markdown 或获取试用许可证以获得完全访问权限!

有用的资源

探索文档,代码样本和社区支持,以增强您的体验。

导出其他格式为 Markdown

GroupDocs.Markdown for Python via .NET 支持 30 多种输入格式。以下导出最常用的几种。

临时许可提示

1
使用您的工作电子邮件地址进行注册。不允许使用免费邮件服务。
2
使用第二步中的获取临时许可证按钮。
 中国人