GroupDocs.Parser for .NET 是一个文本、元数据和图像提取器 API,适用于使用 C#、ASP.NET 和其他 .NET 技术开发的业务应用程序。它支持从支持格式的文件中提取原始、格式化和结构化文本以及元数据。通过 GroupDocs.Parser for .NET,您的应用程序还可以解析流行格式的受密码保护的文档,例如 Word 处理文档、Excel 电子表格、PowerPoint 演示文稿、OneNote、PDF 文件和 ZIP 存档。
GroupDocs.Parser API 是需要文件文本提取功能的企业解决方案的正确选择。这些 API 在所有主要操作系统和平台(包括 Frameworks: .NET Framework, .NET Standard, .NET Core, Mono)上均得到良好支持。
GroupDocs.Parser for .NET 让 C# 开发者只需执行几个简单的步骤即可轻松从 PDF 文件中提取文本。
// 使用 GroupDocs.Parser API 从 PDF 文件中提取文本
// 创建 Parser 类的实例
using (Parser parser = new Parser(filePath)) {
// 将文本提取到阅读器中
using (TextReader reader = parser.GetText()) {
// 打印文档中的文本
// 如果不支持文本提取,则 reader 为空
Console.WriteLine(reader == null ? "不支持文本提取" : reader.ReadToEnd());
}
}
GroupDocs.Parser for .NET 所有主要平台和操作系统均支持 API。在执行下面的代码之前,请确保您的系统上安装了以下先决条件。
立即访问 GroupDocs.Parser 现场演示 网站,从 PDF 文件中提取文本。 现场演示有以下好处。
无需下载 API
无需编写任何代码
只需上传源文件
获取下载链接以保存文件
.NET 用于文件格式和图像的文档解析和文本提取 API。提取一些流行文件格式的数据,如下所述。
(PowerPoint Slide Show)
(Microsoft PowerPoint 97-2003)
(Open XML presentation Format)
(Rich Text Format)
(LaTeX Source Document)
(The 7th Guest Video File)
(Visio Macro-Enabled Drawing)
(Visio Drawing)
(Visio Macro-Enabled Stencil File)
(Visio Stencil File)
(Visio Macro-Enabled Drawing Template)
(Visio Drawing Template)
(Visio Stencil XML File)
(Anim8or 3D Model)
(Excel Macro-Enabled Add-In)
(Microsoft Excel Spreadsheet (Legacy))