Document Parser SDK

開発者に優しい Document Parser SDKで、50 以上のドキュメントと画像形式からテキスト、画像、バーコード、メタデータ、テーブルを抽出します。

最小限のコードで、.NET、Java、Python アプリケーションに高性能なドキュメント解析を統合できます。

柔軟なテンプレートと高度な API を使用して、解析ルールをカスタマイズし、クリーンで構造化されたデータ出力を提供します。

プラットフォームを選択

GroupDocs.Parser の概要

PDF、Office ドキュメント、画像、メール、アーカイブから構造化データと非構造化データを抽出する強力な Document Parser SDK。

テキスト抽出
さまざまなファイル形式からテキスト情報を抽出します
画像抽出
多様なソースからビジュアルコンテンツを取得します
テンプレートによるデータ解析
カスタムテンプレートを作成し、特定情報の解析に利用します
PDF フォーム解析
PDF フォームは、ユーザーが入力できるフィールドを備えたデジタル文書です

GroupDocs.Parser コードサンプル

C#, Java および Python における典型的な GroupDocs.Parser 操作のユースケース

PDF ドキュメントからテキストを抽出する方法

GroupDocs.Parser API は、数ステップの実装でドキュメントからテキストを簡単に抽出できます。

C# Java Python

  // 目的のファイルを渡して Parser クラスのインスタンスを作成する
  using (var parser = new Parser("source.pdf"))
  {
      // テキストを抽出する
      using (var textReader = parser.GetText())
      {
          // 抽出したテキストを処理する
          Console.WriteLine(textReader?.ReadToEnd());
      }
  }

  // 目的のファイルを渡して Parser クラスのインスタンスを作成する
  try (Parser parser = new Parser("source.pdf"))
  {
      // テキストを抽出する
      try (TextReader reader = parser.getText())
      {
          // 抽出したテキストを処理する
          System.out.println(reader == null 
                  ? "" 
                  : reader.readToEnd());
      }
  }

  from groupdocs.parser import Parser

  # 目的のファイルを渡して Parser クラスのインスタンスを作成する
  with Parser("source.pdf") as parser:
      # テキストを抽出する
      text = parser.get_text()

      # 抽出したテキストを処理する
      print(text)

GroupDocs.Parser の実績

当ライブラリの成果に関する主要指標を確認してください

50+
対応フォーマット
GroupDocs.Parser は、50 以上の主要ファイル形式での操作をサポートしています。
1600k
NuGet ダウンロード数
.NET 用 GroupDocs.Parser NuGet パッケージは 1,600,000 回以上ダウンロードされています。
18k
Maven ダウンロード数
GroupDocs.Parser は Maven で 18,000 回ダウンロードされました。強力な Java パーシング機能を提供します。
140+
満足したお客様
有名企業や個人開発者も、革新的なソリューションを構築するためにGroupDocsの製品を選んでいます。

当社の満足したお客様

GroupDocsのライブラリは、世界中で高く評価されている著名なブランドによって使用されています。

プラットフォームに依存しない

GroupDocs.Parser ライブラリは以下の OS とフレームワークをサポートしています：

.NET Framework 4.6.2 or higher
.NET Core 2.0 or higher
.NET 6.0 or higher

Windows
Linux
Mac OS

Microsoft Visual Studio
JetBrains Rider
Microsoft Visual Code

50+ file formats

Java 8 or higher
Kotlin

Windows
Linux
Mac OS

IntelliJ IDEA
Eclipse
NetBeans

50+ file formats

Python 3.5+

Windows
Linux
macOS

PyCharm, VS Code, Jupyter Notebook

50+ file formats

開始する準備はできましたか？

ご使用のプラットフォームでGroupDocs.Parserの機能を無料でお試しください

有用なリソース

ドキュメント、コードサンプル、コミュニティサポートを調べて、体験を向上させます。

よくある質問

最もよく寄せられる質問への回答です。

GroupDocs.Parser ライブラリは、ドキュメント操作に他のサードパーティ製ソフトウェアを必要としますか？
GroupDocs.Parser は、Adobe Acrobat や Microsoft Office などの外部ソフトウェアのインストールを必要としません。
購入前に GroupDocs.Parser ライブラリを試用できますか？
はい、ライセンスを購入せずに GroupDocs.Parser を試すことができます。ライセンスなしでインストールすると、ライブラリはトライアルモードで動作します。このモードでは、結果のドキュメントにトライアルバッジが付加され、最初の3ページに切り詰められます。GroupDocs.Parser をトライアル版の制限なくテストしたい場合は、30日間の一時ライセンスをリクエストすることも可能です。詳細については、参照。
どのようなライセンスがありますか？
特定の開発者や企業のニーズに合わせた複数のライセンス形態をご用意しています。ライセンス形態は、開発者数、開発拠点数、エンドユーザーへの SDK/API の提供有無に応じて決定されます。また、製品の月間使用量に基づく従量課金型ライセンスも選択可能です。詳細はこちらをご覧ください。