GroupDocs.Parser를 사용하여 .NET 프로젝트에서 ODP 문서에서 이미지를 추출하는 단계는 다음과 같습니다:
- ODP 파일로 Parser를 초기화합니다.
- 문서에서 이미지 요소를 가져옵니다.
- 필요에 따라 추출된 이미지를 워크플로에 사용합니다.
GroupDocs.Parser를 사용하여 .NET 프로젝트에서 ODP 문서에서 이미지를 추출하는 단계는 다음과 같습니다:
// Parser를 사용하여 이미지를 포함한 문서를 엽니다.
using (Parser parser = new Parser("input.odp")) {
// 파일에서 모든 내장 이미지를 추출합니다.
IEnumerable<PageImageArea> images = parser.GetImages();
// 이미지가 발견되지 않은 경우를 처리합니다.
if (images == null)
{
return;
}
// 가져온 이미지를 처리하거나 저장합니다.
foreach (PageImageArea image in images)
{
Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}",
image.Page.Index, image.Rectangle, image.FileType));
}
}
GroupDocs.Parser는 이미지 추출 이상의 기능을 제공합니다. 원시 텍스트, 하이퍼링크, 메타데이터 및 구조화된 콘텐츠를 추출하여 고급 자동화 시나리오에 활용할 수 있습니다.
DOCX, PDF, PPTX, XLSX 및 PNG, JPG, TIFF와 같은 이미지 파일을 포함한 다양한 파일 형식에서 내장 이미지를 추출할 수 있습니다.
이미지는 원래 해상도, 형식 및 색상 프로필을 유지하여 높은 충실도로 추출됩니다.
페이지, 형식 또는 해상도별로 필터링하여 이미지 추출을 사용자 정의하며, 다중 페이지 문서도 지원합니다.
이 예제는 PDF 파일에서 모든 이미지 자산을 추출하고 로컬 파일 시스템에 저장하는 방법을 보여줍니다.
// Parser 클래스를 사용하여 PDF를 로드합니다.
using (Parser parser = new Parser("input.pdf"))
{
// 파일에서 내장 이미지를 추출합니다.
IEnumerable<PageImageArea> images = parser.GetImages();
// 출력 형식 및 이미지 옵션(예: PNG)을 설정합니다.
ImageOptions options = new ImageOptions(ImageFormat.Png);
// 추출된 이미지를 디스크에 씁니다.
int imageNumber = 0;
foreach (PageImageArea image in images)
{
image.Save(imageNumber.ToString() + ".png", options);
imageNumber++;
}
}