按照以下步骤使用GroupDocs.Parser在您的Java应用程序中提取ODP文档的图像:
- 创建一个Parser实例并加载ODP文件。
- 从加载的文档中提取图像数据。
- 根据需要使用或导出提取的图像。
按照以下步骤使用GroupDocs.Parser在您的Java应用程序中提取ODP文档的图像:
// 初始化解析器并使用Parser加载包含图像的文档
try (Parser parser = new Parser("input.odp"))
{
// 收集文档中嵌入的所有图像元素
Iterable<PageImageArea> images = parser.getImages();
// 如果文档没有图像,则跳过处理
if (images == null) {
return;
}
// 根据需要处理每一张图像
for (PageImageArea image : images) {
System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(),
image.getRectangle(), image.getFileType()));
}
}
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>24.9</version>
</dependency>
</dependencies>
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://repository.groupdocs.com/repo/</url>
</repository>
</repositories>
除了图像提取外,GroupDocs.Parser还允许您提取原始内容,如文本、链接、元数据和结构化数据,以便进行处理和分析。
从不同类型的文档中提取图像,包括PDF、DOCX、PPTX、XLSX,以及PNG、JPEG和GIF等图像格式。
所有提取的图像均保留其原始分辨率和文件类型,以确保一致的质量和可用性。
通过按类型、大小、页面索引或文件格式过滤图像,自定义图像提取过程。
本示例演示如何从PDF文档中提取图像,并单独将其保存在您的设备上。
// 使用Parser打开PDF文件
try (Parser parser = new Parser("input.pdf"))
{
// 从文档内容中获取图像
Iterable<PageImageArea> images = parser.getImages();
// 设置输出参数,例如格式(如JPEG或PNG)
ImageOptions options = new ImageOptions(ImageFormat.Png);
// 将提取的图像保存到本地目录
int imageNumber = 0;
for (PageImageArea image : images)
{
image.save(Constants.getOutputFilePath(String.format("%d.png", imageNumber)), options);
imageNumber++;
}
}