GroupDocs.Parser の概要
Python アプリケーションで高精度な文書解析を実行するための Document Parser SDK
ドキュメントからデータを抽出
GroupDocs.Parser for Python via .NET API を使用すると、Office ドキュメント、メール、添付ファイル、アーカイブなど、さまざまなファイル形式からテキスト、メタデータ、画像を取得できます。この強力なツールにより、データ分析、検索エンジンのインデックス作成、コンテンツ管理システムなど、様々なアプリケーションで必要となる情報を効率的にアクセス・処理できます。
ドキュメントを解析
PDF フォームからハイパーリンク、テーブル、QR コード、バーコード、およびデータなどのさまざまな要素を抽出します。また、カスタムテンプレートを使用してドキュメントから任意の情報を解析できます。
結果のカスタマイズ
Python API を使用すると、RAW、構造化、HTML、Markdown など、さまざまな形式でデータを取得できます。さらに、ドキュメントテキスト内の特定の単語やフレーズを検索する機能も提供します。

