以下は、GroupDocs.Parserfor.NETの概要です。
*画像を抽出する
*生のテキストを抽出する
*フォーマットされたテキストを抽出する
*構造化テキストを抽出する
*メタデータを抽出する
*ZIPファイル内のファイルから抽出
*検索して抽出
*テキストフォーマッタで抽出
*エンコーディング標準を検出
*メディアタイプの検出
*入力ファイルを取得します
*生またはフォーマットされたテキストをフェッチします
*メタデータを取得します
GroupDocs.Parser for .NETは、次の[ドキュメントファイル形式](https://docs.groupdocs.com/parser/net/supported-document-formats/)をサポートしています。
- テキスト:DOC、DOCX、DOT、DOTM、DOTX、DOCM、RTF、ODT、OTT、TXT、MD、WordprocessingML(XML)
- スプレッドシート:XLS、XLSX、CSV、XLSM、XLSB、ODS、SpreadsheetML(XML)、XLT、XLTX、XLTM、OTS、XLA 、、 XLAM、TSV
- プレゼンテーション:PPT、PPTX、PPTM、PPS、PPSX、PPSM、POT、POTX、POTM、ODP、OTP
- ** OneNote **:ONE
- メール:MSG、EML、EMLX、PST、OST、MS EXCHANGE SERVER、POP、IMAP
- 電子出版:EPUB、FB2
- ポータブルドキュメント:PDF、PDFポートフォリオ、暗号化されたPDF
- ** DOMベース**:XML、HTML、XHTML、MHTML
- 圧縮とパッケージ化:ZIP、CHM
- データベース:ADO.NET
- ** BOM **:UTF32 LE、UTF32 BE、UTF16 LE、UTF16 BE、UTF8、およびUTF7
- コンテンツ:UTF32 LE、UTF32 BE、UTF16 LE、UTF16 BE、UTF8、およびANSI
- テキスト:DOC、DOCX、DOT、DOTX、DOTM、OTT、ODT
- スプレッドシート:XLS、XLSX、XLT、XLTX、XLTM、XLA、XLAM、OTS、ODS
- プレゼンテーション:PPT、PPTX、POT、POTX、POTM、PPSM、PPTM、OTP、ODP
- メール:MSG、EML、EMLX
- 電子出版:EPUB、FB2
- その他:PDF
- テンプレート:DOTX、POTX
- マクロ対応テンプレート:DOTM、POTM、PPSM、PPTM
- ** OpenDocumentテンプレート**:OTT
- テキスト:DOC、DOCX、DOCM、RTF、DOT、DOTM、DOTX、ODT
- スプレッドシート:XLS、XLSX、XLSM、XLSB、ODS、XLT、XLTM、XLTX
- プレゼンテーション:PPT、PPTX、PPTM、ODP、POT、POTM、POTX、PPS、PPSX、PPSM
- ポータブルドキュメント:PDF、POT、POTM、POTX
- 電子書籍:CHM、EPUB、FB2
- マークアップ:HTML
GroupDocs.Parser for .NETは、次のオペレーティングシステム、フレームワーク、およびパッケージマネージャーをサポートしています。
*Windowsデスクトップ
- WindowsServer
- Windows Azure
- Linux
- .NETFramework2.0以降
- MonoFramework1.2以降
- .NET Standard 2.0
- .NET Core 2.0
- Microsoft Visual Studio
- Xamarin.Android
- Xamarin.IOS
- Xamarin.Mac
- MonoDevelop