GroupDocs.Parser for .NET

C#를 사용하여 ODP에서 이미지 추출하기

GroupDocs.Parser를 통해 PDF, 워드 문서, 엑셀 시트 및 기타 파일 유형에서 내장 이미지를 신속하게 찾고 추출할 수 있습니다.

NuGet 다운로드

무료 평가판 시작

C#에서 Odp의 이미지를 추출하는 단계

GroupDocs.Parser를 사용하여 .NET 프로젝트에서 ODP 문서에서 이미지를 추출하는 단계는 다음과 같습니다:

ODP 파일로 Parser를 초기화합니다.
문서에서 이미지 요소를 가져옵니다.
필요에 따라 추출된 이미지를 워크플로에 사용합니다.

복사

// Parser를 사용하여 이미지를 포함한 문서를 엽니다.
using (Parser parser = new Parser("input.odp")) {

    // 파일에서 모든 내장 이미지를 추출합니다.
    IEnumerable<PageImageArea> images = parser.GetImages();

    // 이미지가 발견되지 않은 경우를 처리합니다.
    if (images == null)
    {
        return;
    }

    // 가져온 이미지를 처리하거나 저장합니다.
    foreach (PageImageArea image in images)
    {
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}

dotnet add package GroupDocs.Parser

클릭하여 복사

복사되었습니다

더 많은 예시 문서화

종합 문서 내용 추출

GroupDocs.Parser는 이미지 추출 이상의 기능을 제공합니다. 원시 텍스트, 하이퍼링크, 메타데이터 및 구조화된 콘텐츠를 추출하여 고급 자동화 시나리오에 활용할 수 있습니다.

다양한 형식에서 이미지 추출

DOCX, PDF, PPTX, XLSX 및 PNG, JPG, TIFF와 같은 이미지 파일을 포함한 다양한 파일 형식에서 내장 이미지를 추출할 수 있습니다.

원본 이미지 품질 유지

이미지는 원래 해상도, 형식 및 색상 프로필을 유지하여 높은 충실도로 추출됩니다.

고급 추출 옵션

페이지, 형식 또는 해상도별로 필터링하여 이미지 추출을 사용자 정의하며, 다중 페이지 문서도 지원합니다.

PDF 문서에서 이미지를 추출하고 저장하는 방법

이 예제는 PDF 파일에서 모든 이미지 자산을 추출하고 로컬 파일 시스템에 저장하는 방법을 보여줍니다.

C#

//  Parser 클래스를 사용하여 PDF를 로드합니다.
using (Parser parser = new Parser("input.pdf"))
{
    // 파일에서 내장 이미지를 추출합니다.
    IEnumerable<PageImageArea> images = parser.GetImages();

    // 출력 형식 및 이미지 옵션(예: PNG)을 설정합니다.
    ImageOptions options = new ImageOptions(ImageFormat.Png);

    // 추출된 이미지를 디스크에 씁니다.
    int imageNumber = 0;
    foreach (PageImageArea image in images)
    {
        image.Save(imageNumber.ToString() + ".png", options);
        imageNumber++;
    }
}

GroupDocs.Parser for .NET API 소개

GroupDocs.Parser는 .NET 개발자를 위한 강력한 문서 파싱 라이브러리입니다. PDF, DOCX, XLSX, PPTX와 같은 인기 있는 파일 형식에서 이미지, 텍스트, 하이퍼링크 및 구조화된 데이터를 추출할 수 있으며, 타사 응용 프로그램이 필요 없습니다.

더 알아보기