.NET API 来提取文档数据

从 .NET 应用程序中的文档、电子表格、演示文稿、电子邮件和档案中提取图像、原始或格式化文本和元数据。


下载免费试用版

GroupDocs.Parser for .NET 是一个文本、元数据和图像提取器 API,用于使用 C#、ASP.NET 和其他 .NET 技术开发的业务应用程序。它支持从支持格式的文件中提取原始、格式化和结构化文本以及元数据。通过 GroupDocs.Parser for .NET,您的应用程序还可以对流行格式的受密码保护的文档进行解析,例如文字处理文档、Excel 电子表格、PowerPoint 演示文稿、OneNote、PDF 文件和 ZIP 档案。

GroupDocs.Parser for .NET 特征

从文档中提取文本

使用 GroupDocs.Parser for .NET API 从文档中提取文本很简单,只需几行代码即可实现:

// 创建 Parser 类的实例
using(Parser parser = new Parser("sample.docx"))
{
  // 将文本提取到阅读器中
  using(TextReader reader = parser.GetText())
  {
    // 打印文档中的文本
    // 如果不支持文本提取,则 reader 为 null
    Console.WriteLine(reader == null ? "Text extraction isn't supported." : reader.ReadToEnd());
  }
}

支持和学习资源

GroupDocs.Parser 为其他流行的开发环境提供文档查看 API

Back to top
 中国人