データを抽出するJavaパーサーAPI

ドキュメント、プレゼンテーション、アーカイブ、メールからメタデータを使用して画像やテキストを解析および抽出するJavaAPI。


無料トライアルをダウンロード

GroupDocs.Parser for Javaは、テキスト、画像、メタデータの抽出APIであり、生の構造化されフォーマットされたテキストを解析する機能を備えたビジネスアプリケーションの構築を支援する50以上の一般的なドキュメントタイプをサポートします。また、事前定義されたテンプレートを使用したドキュメントの解析をサポートし、請求書やその他の一般的なドキュメントから複雑なデータを迅速かつ正確に抽出できます。 GroupDocs.Parser for Javaを使用すると、ワードプロセッシングドキュメント、Excelスプレッドシート、PowerPointプレゼンテーション、OneNote、PDFファイル、ZIPアーカイブなど、すべての一般的な形式のパスワードで保護されたファイルからテキストとメタデータを抽出できます。

GroupDocs.Parser for Java Features

プレーンテキストまたはHTMLフォーマッタでテキストを取得する

GroupDocs.Parser for Javaを使用すると、さまざまなフォーマッタをテキストとHTMLに適用できます。 SimpleとASCIIの両方でPlainTextFormatterを使用してテキストをプルできます。 HTML Formatterを使用してテキストを取得し、段落、ハイパーリンク、フォント、見出し、リスト、および表に書式を適用することもできます。

サポートおよび学習リソース

GroupDocs.Parserは、他の一般的な開発環境向けのドキュメント表示APIを提供します

Back to top
 日本