以下是 .NET 的 GroupDocs.Parser 的概述:
- 提取图像
- 提取原始文本
- 提取格式化文本
- 提取结构化文本
- 提取元数据
- 从 ZIP 文件中的文件中提取
- 搜索提取
- 使用文本格式化程序提取
- 检测编码标准
- 检测媒体类型
GroupDocs.Parser for .NET 支持以下 文档文件格式:
- 文本:DOC、DOCX、DOT、DOTM、DOTX、DOCM、RTF、ODT、OTT、TXT、MD、WordprocessingML (XML)
- 电子表格:XLS、XLSX、CSV、XLSM、XLSB、ODS、SpreadsheetML (XML)、XLT、XLTX、XLTM、OTS、XLA、XLAM、TSV
- 演示文稿:PPT、PPTX、PPTM、PPS、PPSX、PPSM、POT、POTX、POTM、ODP、OTP
- OneNote:一个
- 电子邮件:MSG、EML、EMLX、PST、OST、MS EXCHANGE SERVER、POP、IMAP
- 电子出版:EPUB、FB2
- 便携式文档:PDF、PDF 包、加密 PDF
- 基于DOM的:XML、HTML、XHTML、MHTML
- 压缩和包装:ZIP、CHM
- 数据库:ADO.NET
- BOM:UTF32 LE、UTF32 BE、UTF16 LE、UTF16 BE、UTF8 和 UTF7
- 内容:UTF32 LE、UTF32 BE、UTF16 LE、UTF16 BE、UTF8 和 ANSI
- 文本:DOC、DOCX、DOT、DOTX、DOTM、OTT、ODT
- 电子表格:XLS、XLSX、XLT、XLTX、XLTM、XLA、XLAM、OTS、ODS
- 演示文稿:PPT、PPTX、POT、POTX、POTM、PPSM、PPTM、OTP、ODP
- 电子邮件:味精、EML、EMLX
- 电子出版:EPUB、FB2
- 其他:PDF
- 模板:DOTX、POTX
- 启用宏的模板:DOTM、POTM、PPSM、PPTM
- OpenDocument 模板:OTT
- 文本:DOC、DOCX、DOCM、RTF、DOT、DOTM、DOTX、ODT
- 电子表格:XLS、XLSX、XLSM、XLSB、ODS、XLT、XLTM、XLTX
- 演示文稿:PPT、PPTX、PPTM、ODP、POT、POTM、POTX、PPS、PPSX、PPSM
- 便携式文档:PDF、POT、POTM、POTX
- 电子书:CHM、EPUB、FB2
- 标记:HTML
GroupDocs.Parser for .NET 支持以下操作系统、框架和包管理器:
- Windows Desktop
- Windows Server
- Windows Azure
- Linux
- .NET Framework 2.0 或更高版本
- Mono 框架 1.2 或更高版本
- .NET 标准 2.0
- .NET Core 2.0
- Microsoft Visual Studio
- Xamarin.Android
- Xamarin.IOS
- Xamarin.Mac
- MonoDevelop