借助GroupDocs.Parser,您可以在数个步骤中从ODP文档中提取图像:
- 用ODP文件初始化Parser。
- 从文档中获取图像元素。
- 按需在您的工作流程中使用提取的图像。
借助GroupDocs.Parser,您可以在数个步骤中从ODP文档中提取图像:
// 使用Parser打开包含图像的文档
using (Parser parser = new Parser("input.odp")) {
// 从文件中提取所有嵌入的图像
IEnumerable<PageImageArea> images = parser.GetImages();
// 处理未找到图像的情况
if (images == null)
{
return;
}
// 处理或保存检索到的图像
foreach (PageImageArea image in images)
{
Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}",
image.Page.Index, image.Rectangle, image.FileType));
}
}
GroupDocs.Parser不仅提供图像提取功能,还支持提取原始文本、超链接、元数据和结构化内容,满足高级自动化场景的需求。
从多种文件格式(包括DOCX、PDF、PPTX、XLSX以及图像文件如PNG、JPG和TIFF)中提取嵌入图像。
图像以高保真度提取,保持原始分辨率、格式和色彩配置文件。
通过按页、格式或分辨率筛选定制图像提取,并支持多页文档。
本示例演示如何从PDF文件中提取所有图像资源并保存到本地文件系统。
// 使用Parser类加载PDF
using (Parser parser = new Parser("input.pdf"))
{
// 从文件中提取嵌入图像
IEnumerable<PageImageArea> images = parser.GetImages();
// 设置输出格式和图像选项(例如,PNG)
ImageOptions options = new ImageOptions(ImageFormat.Png);
// 将提取的图像写入磁盘
int imageNumber = 0;
foreach (PageImageArea image in images)
{
image.Save(imageNumber.ToString() + ".png", options);
imageNumber++;
}
}