GroupDocs.Parser for .NET 是一个文本、元数据和图像提取器 API,适用于使用 C#、ASP.NET 和其他 .NET 技术开发的业务应用程序。它支持从支持格式的文件中提取原始、格式化和结构化文本以及元数据。通过 GroupDocs.Parser for .NET,您的应用程序还可以解析流行格式的受密码保护的文档,例如 Word 处理文档、Excel 电子表格、PowerPoint 演示文稿、OneNote、PDF 文件和 ZIP 存档。
GroupDocs.Parser API 是需要文件文本提取功能的企业解决方案的正确选择。这些 API 在所有主要操作系统和平台(包括 Frameworks: .NET Framework, .NET Standard, .NET Core, Mono)上均得到良好支持。
GroupDocs.Parser for .NET 让 C# 开发者只需执行几个简单的步骤即可轻松从 XML 文件中提取文本。
// 使用 GroupDocs.Parser API 从 XML 文件中提取文本
// 创建 Parser 类的实例
using (Parser parser = new Parser(filePath)) {
// 将文本提取到阅读器中
using (TextReader reader = parser.GetText()) {
// 打印文档中的文本
// 如果不支持文本提取,则 reader 为空
Console.WriteLine(reader == null ? "不支持文本提取" : reader.ReadToEnd());
}
}
GroupDocs.Parser for .NET 所有主要平台和操作系统均支持 API。在执行下面的代码之前,请确保您的系统上安装了以下先决条件。
立即访问 GroupDocs.Parser 现场演示 网站,从 XML 文件中提取文本。 现场演示有以下好处。
无需下载 API
无需编写任何代码
只需上传源文件
获取下载链接以保存文件