開発者に優しい Document Parser SDKで、50 以上のドキュメントと画像形式からテキスト、画像、バーコード、メタデータ、テーブルを抽出します。
最小限のコードで、.NET、Java、Python アプリケーションに高性能なドキュメント解析を統合できます。
柔軟なテンプレートと高度な API を使用して、解析ルールをカスタマイズし、クリーンで構造化されたデータ出力を提供します。
PDF、Office ドキュメント、画像、メール、アーカイブから構造化データと非構造化データを抽出する強力な Document Parser SDK。
さまざまなファイル形式からテキスト情報を抽出します
多様なソースからビジュアルコンテンツを取得します
カスタムテンプレートを作成し、特定情報の解析に利用します
PDF フォームは、ユーザーが入力できるフィールドを備えたデジタル文書です
C#, Java および Python における典型的な GroupDocs.Parser 操作のユースケース
// 目的のファイルを渡して Parser クラスのインスタンスを作成する
using (var parser = new Parser("source.pdf"))
{
// テキストを抽出する
using (var textReader = parser.GetText())
{
// 抽出したテキストを処理する
Console.WriteLine(textReader?.ReadToEnd());
}
}
// 目的のファイルを渡して Parser クラスのインスタンスを作成する
try (Parser parser = new Parser("source.pdf"))
{
// テキストを抽出する
try (TextReader reader = parser.getText())
{
// 抽出したテキストを処理する
System.out.println(reader == null
? ""
: reader.readToEnd());
}
}
from groupdocs.parser import Parser
# 目的のファイルを渡して Parser クラスのインスタンスを作成する
with Parser("source.pdf") as parser:
# テキストを抽出する
text = parser.get_text()
# 抽出したテキストを処理する
print(text)
GroupDocs.Parser Document Parser SDK は、Office ドキュメント、PDF、画像、メール、アーカイブなどの解析操作を可能にします。
当ライブラリの成果に関する主要指標を確認してください
GroupDocs.Parser は、50 以上の主要ファイル形式での操作をサポートしています。
.NET 用 GroupDocs.Parser NuGet パッケージは 1,600,000 回以上ダウンロードされています。
GroupDocs.Parser は Maven で 18,000 回ダウンロードされました。強力な Java パーシング機能を提供します。
有名企業や個人開発者も、革新的なソリューションを構築するためにGroupDocsの製品を選んでいます。
GroupDocsのライブラリは、世界中で高く評価されている著名なブランドによって使用されています。
GroupDocs.Parser ライブラリは以下の OS とフレームワークをサポートしています:
最もよく寄せられる質問への回答です。
クラウドベースの REST API と SDK を使用して、任意のアプリケーションにドキュメント解析機能を組み込むことができます。
cURL コマンドを使用した RESTful ドキュメント パーサ クラウド API で、幅広いサポート対象の一般的なファイル形式のドキュメントを解析します。
Microsoft .NET アプリケーションで、画像、テキスト、ドキュメント情報を抽出したり、ユーザー定義テンプレートで任意のドキュメントを解析したりできます。
Java 開発者向けのクラウド SDK で、ドキュメントを解析し、Java ベースのアプリケーション内でドキュメント情報とデータを抽出できます。
Web ベースのドキュメント パーサ アプリで、ブラウザー上で 50 以上の一般的なファイル形式からデータを直接抽出できます。