Document Parser SDK

開発者に優しい Document Parser SDKで、50 以上のドキュメントと画像形式からテキスト、画像、バーコード、メタデータ、テーブルを抽出します。

最小限のコードで、.NET、Java、Python アプリケーションに高性能なドキュメント解析を統合できます。

柔軟なテンプレートと高度な API を使用して、解析ルールをカスタマイズし、クリーンで構造化されたデータ出力を提供します。

GroupDocs.Parser の概要

PDF、Office ドキュメント、画像、メール、アーカイブから構造化データと非構造化データを抽出する強力な Document Parser SDK。

  • テキスト抽出

    さまざまなファイル形式からテキスト情報を抽出します

  • 画像抽出

    多様なソースからビジュアルコンテンツを取得します

  • テンプレートによるデータ解析

    カスタムテンプレートを作成し、特定情報の解析に利用します

  • PDF フォーム解析

    PDF フォームは、ユーザーが入力できるフィールドを備えたデジタル文書です

GroupDocs.Parser コードサンプル

C#, Java および Python における典型的な GroupDocs.Parser 操作のユースケース

PDF ドキュメントからテキストを抽出する方法

GroupDocs.Parser API は、数ステップの実装でドキュメントからテキストを簡単に抽出できます。
  // 目的のファイルを渡して Parser クラスのインスタンスを作成する
  using (var parser = new Parser("source.pdf"))
  {
      // テキストを抽出する
      using (var textReader = parser.GetText())
      {
          // 抽出したテキストを処理する
          Console.WriteLine(textReader?.ReadToEnd());
      }
  }     
  // 目的のファイルを渡して Parser クラスのインスタンスを作成する
  try (Parser parser = new Parser("source.pdf"))
  {
      // テキストを抽出する
      try (TextReader reader = parser.getText())
      {
          // 抽出したテキストを処理する
          System.out.println(reader == null 
                  ? "" 
                  : reader.readToEnd());
      }
  }  
  from groupdocs.parser import Parser

  # 目的のファイルを渡して Parser クラスのインスタンスを作成する
  with Parser("source.pdf") as parser:
      # テキストを抽出する
      text = parser.get_text()

      # 抽出したテキストを処理する
      print(text)

50 以上のドキュメントと画像形式をサポート

GroupDocs.Parser Document Parser SDK は、Office ドキュメント、PDF、画像、メール、アーカイブなどの解析操作を可能にします。

GroupDocs.Parser の実績

当ライブラリの成果に関する主要指標を確認してください

  • 50+

    対応フォーマット

    GroupDocs.Parser は、50 以上の主要ファイル形式での操作をサポートしています。

  • 1600k

    NuGet ダウンロード数

    .NET 用 GroupDocs.Parser NuGet パッケージは 1,600,000 回以上ダウンロードされています。

  • 18k

    Maven ダウンロード数

    GroupDocs.Parser は Maven で 18,000 回ダウンロードされました。強力な Java パーシング機能を提供します。

  • 140+

    満足したお客様

    有名企業や個人開発者も、革新的なソリューションを構築するためにGroupDocsの製品を選んでいます。

当社の満足したお客様

GroupDocsのライブラリは、世界中で高く評価されている著名なブランドによって使用されています。

プラットフォームに依存しない

GroupDocs.Parser ライブラリは以下の OS とフレームワークをサポートしています:

.NET

.NET Framework 4.6.2 or higher
.NET Core 2.0 or higher
.NET 6.0 or higher
Windows
Linux
Mac OS
Microsoft Visual Studio
JetBrains Rider
Microsoft Visual Code
50+ file formats

Java

Java 8 or higher
Kotlin
Windows
Linux
Mac OS
IntelliJ IDEA
Eclipse
NetBeans
50+ file formats

Python

Python 3.5+
Windows
Linux
macOS
PyCharm, VS Code, Jupyter Notebook
50+ file formats

開始する準備はできましたか?

ご使用のプラットフォームでGroupDocs.Parserの機能を無料でお試しください

有用なリソース

ドキュメント、コードサンプル、コミュニティサポートを調べて、体験を向上させます。

よくある質問

最もよく寄せられる質問への回答です。

  • GroupDocs.Parser ライブラリは、ドキュメント操作に他のサードパーティ製ソフトウェアを必要としますか?
    GroupDocs.Parser は、Adobe Acrobat や Microsoft Office などの外部ソフトウェアのインストールを必要としません。
  • 購入前に GroupDocs.Parser ライブラリを試用できますか?
    はい、ライセンスを購入せずに GroupDocs.Parser を試すことができます。ライセンスなしでインストールすると、ライブラリはトライアルモードで動作します。このモードでは、結果のドキュメントにトライアルバッジが付加され、最初の3ページに切り詰められます。GroupDocs.Parser をトライアル版の制限なくテストしたい場合は、30日間の一時ライセンスをリクエストすることも可能です。詳細については、参照
  • どのようなライセンスがありますか?
    特定の開発者や企業のニーズに合わせた複数のライセンス形態をご用意しています。ライセンス形態は、開発者数、開発拠点数、エンドユーザーへの SDK/API の提供有無に応じて決定されます。また、製品の月間使用量に基づく従量課金型ライセンスも選択可能です。詳細はこちらをご覧ください。

GroupDocs.Parser ローコード ドキュメント パーサ API

クラウドベースの REST API と SDK を使用して、任意のアプリケーションにドキュメント解析機能を組み込むことができます。

GroupDocs.Parser ドキュメント パーサ ノーコード アプリ

Web ベースのドキュメント パーサ アプリで、ブラウザー上で 50 以上の一般的なファイル形式からデータを直接抽出できます。

 日本