GroupDocs.Parser for Java

Java を使用して ODP から画像を抽出

PDF、Word、Excel などのファイルから埋め込まれた画像を、Java 開発環境で GroupDocs.Parser を使用して取得できます。

Java で Odp から画像を抽出する方法

GroupDocs.Parser を使用して Java アプリケーション内の ODP ドキュメントから画像を抽出するための手順は次のとおりです:

  1. Parser インスタンスを作成し、ODP ファイルをロードします。
  2. ロードしたドキュメントから画像データを抽出します。
  3. 必要に応じて抽出した画像を使用またはエクスポートします。
// Parser を使用してパーサーを初期化し、画像を含むドキュメントをロードします
try (Parser parser = new Parser("input.odp"))
{
    // ドキュメントに埋め込まれているすべての画像要素を収集します
    Iterable<PageImageArea> images = parser.getImages();

    // ドキュメントに画像がない場合は処理をスキップします
    if (images == null) {
        return;
    }

    // 必要に応じて各画像を処理します
    for (PageImageArea image : images) {
        System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), 
            image.getRectangle(), image.getFileType()));
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
クリックしてコピー
コピーしました
さらなる例 ドキュメンテーション

その他のドキュメントパース機能

画像抽出に加えて、GroupDocs.Parser を使用すると、生のコンテンツ(テキスト、リンク、メタデータ、構造化データ)を抽出して処理および分析することができます。

ドキュメントから画像とコンテンツを抽出

さまざまなフォーマットに対応

PDF、DOCX、PPTX、XLSX などの異なる文書タイプ、ならびに PNG、JPEG、GIF などの画像フォーマットから画像を抽出します。

画像の明瞭さと解像度を維持

すべての抽出された画像は元の解像度とファイルタイプを保持し、一貫した品質と使いやすさを確保します。

柔軟な設定オプション

画像の種類、サイズ、ページインデックス、またはファイル形式によって画像抽出プロセスをカスタマイズできます。

PDF ファイルから画像を抽出して保存

この例では、PDF ドキュメントから画像を抽出し、それらを個別にデバイスに保存する方法を示します。

Java

//  Parser を使用して PDF ファイルを開きます
try (Parser parser = new Parser("input.pdf"))
{
    // ドキュメントコンテンツから画像を取得します
    Iterable<PageImageArea> images = parser.getImages();

    // 出力パラメータを設定します(例:JPEG または PNG など)
    ImageOptions options = new ImageOptions(ImageFormat.Png);

    // 抽出された画像をローカルディレクトリに保存します
    int imageNumber = 0;
    for (PageImageArea image : images)
    {
        image.save(Constants.getOutputFilePath(String.format("%d.png", imageNumber)), options);
        imageNumber++;
    }
}

GroupDocs.Parser for Java とは?

GroupDocs.Parser は、Java 開発者向けに特化した機能豊富なパース API です。DOCX、XLSX、PDF、PNG、JPG など、さまざまなファイル形式から画像、テキスト、リンク、構造化された要素を抽出でき、外部ライブラリやアプリケーションは不要です。
詳細はこちら
About illustration

始める準備はできていますか?

GroupDocs.Parser を無料でダウンロードするか、フルアクセス用の試用版ライセンスを取得してください。

有用なリソース

ドキュメント、コードサンプル、コミュニティサポートを調べて、体験を向上させます。

画像抽出に対応したファイル形式

GroupDocs.Parser は、幅広いドキュメントと画像に対応した画像抽出をサポートします。一般的にサポートされるフォーマットを以下で探求してください。

一時ライセンスのヒント

1
職場の電子メールで登録してください。フリー メール サービスは使用できません。
2
2 番目のステップで [一時ライセンスを取得] ボタンを使用します。
 日本