GroupDocs.Parser を使用して Java アプリケーション内の ODP ドキュメントから画像を抽出するための手順は次のとおりです:
- Parser インスタンスを作成し、ODP ファイルをロードします。
- ロードしたドキュメントから画像データを抽出します。
- 必要に応じて抽出した画像を使用またはエクスポートします。
GroupDocs.Parser を使用して Java アプリケーション内の ODP ドキュメントから画像を抽出するための手順は次のとおりです:
// Parser を使用してパーサーを初期化し、画像を含むドキュメントをロードします
try (Parser parser = new Parser("input.odp"))
{
// ドキュメントに埋め込まれているすべての画像要素を収集します
Iterable<PageImageArea> images = parser.getImages();
// ドキュメントに画像がない場合は処理をスキップします
if (images == null) {
return;
}
// 必要に応じて各画像を処理します
for (PageImageArea image : images) {
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(),
image.getRectangle(), image.getFileType()));
}
}
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>24.9</version>
</dependency>
</dependencies>
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://repository.groupdocs.com/repo/</url>
</repository>
</repositories>
画像抽出に加えて、GroupDocs.Parser を使用すると、生のコンテンツ(テキスト、リンク、メタデータ、構造化データ)を抽出して処理および分析することができます。
PDF、DOCX、PPTX、XLSX などの異なる文書タイプ、ならびに PNG、JPEG、GIF などの画像フォーマットから画像を抽出します。
すべての抽出された画像は元の解像度とファイルタイプを保持し、一貫した品質と使いやすさを確保します。
画像の種類、サイズ、ページインデックス、またはファイル形式によって画像抽出プロセスをカスタマイズできます。
この例では、PDF ドキュメントから画像を抽出し、それらを個別にデバイスに保存する方法を示します。
// Parser を使用して PDF ファイルを開きます
try (Parser parser = new Parser("input.pdf"))
{
// ドキュメントコンテンツから画像を取得します
Iterable<PageImageArea> images = parser.getImages();
// 出力パラメータを設定します(例:JPEG または PNG など)
ImageOptions options = new ImageOptions(ImageFormat.Png);
// 抽出された画像をローカルディレクトリに保存します
int imageNumber = 0;
for (PageImageArea image : images)
{
image.save(Constants.getOutputFilePath(String.format("%d.png", imageNumber)), options);
imageNumber++;
}
}
GroupDocs.Parser は、幅広いドキュメントと画像に対応した画像抽出をサポートします。一般的にサポートされるフォーマットを以下で探求してください。