用于提取数据的 Java Parser API

Java API,用于从文档、演示文稿、档案和电子邮件中解析和提取带有元数据的图像和文本。


下载免费试用版

GroupDocs.Parser for Java 是一个文本、图像和元数据提取器 API,支持 50 多种流行的文档类型,以帮助构建具有解析原始、结构化和格式化文本功能的业务应用程序。它还支持使用预定义模板解析文档,并允许从发票和其他典型文档中快速准确地提取复杂数据。 GroupDocs.Parser for Java 使您能够从所有流行格式的受密码保护的文件中提取文本和元数据,包括文字处理文档、Excel 电子表格、PowerPoint 演示文稿、OneNote、PDF 文件和 ZIP 档案。

GroupDocs.Parser for Java 特征

使用纯文本或 HTML 格式化程序获取文本

使用 GroupDocs.Parser for Java,您可以将各种格式化程序应用于文本和 HTML。您可以使用纯文本格式化程序为简单和 ASCII 提取文本。您还可以使用 HTML Formatter 获取文本并将格式应用于段落、超链接、字体、标题、列表和表格。

支持和学习资源

GroupDocs.Parser 为其他流行的开发环境提供文档查看 API

Back to top
 中国人