GroupDocs.Parser 概述
用于在 Java 应用程序中执行文档解析的 API
从文档中提取数据
Java API 使您能够从各种文件格式(例如 Office 文档、电子邮件、附件和存档)中检索文本、元数据和图像。这个强大的工具可帮助您有效地访问和处理这些文件中包含的有价值的信息,以用于各种应用程序,例如数据分析、搜索引擎索引或内容管理系统。
解析文档
从PDF表单中提取各种元素,例如超链接、表格、二维码、条形码和数据。还可以使用自定义模板从文档中解析任何所需的信息。
定制结果
Java API 可让您检索各种格式的数据,例如原始格式、结构化格式、HTML 或 Markdown 格式。此外,API 还提供搜索功能,用于在文档文本中查找特定单词或短语。