GroupDocs.Parser for Java

Trích xuất hình ảnh từ ODP bằng Java

Lấy hình ảnh nhúng từ các tệp như PDF, Word, Excel và nhiều hơn nữa bằng GroupDocs.Parser trong môi trường phát triển Java của bạn.

Cách trích xuất hình ảnh từ Odp trong Java

Thực hiện các bước sau để trích xuất hình ảnh từ tài liệu ODP bằng GroupDocs.Parser trong ứng dụng Java của bạn:

  1. Tạo một thể hiện Parser và tải tệp ODP.
  2. Trích xuất dữ liệu hình ảnh từ tài liệu đã tải.
  3. Sử dụng hoặc xuất các hình ảnh đã trích xuất theo yêu cầu.
// Khởi tạo parser và tải tài liệu có hình ảnh bằng Parser
try (Parser parser = new Parser("input.odp"))
{
    // Thu thập tất cả các phần tử hình ảnh nhúng trong tài liệu
    Iterable<PageImageArea> images = parser.getImages();

    // Bỏ qua xử lý nếu tài liệu không có hình ảnh
    if (images == null) {
        return;
    }

    // Xử lý mỗi hình ảnh theo yêu cầu
    for (PageImageArea image : images) {
        System.out.println(String.format("Page: %d, R: %s, Type: %s", image.getPage().getIndex(), 
            image.getRectangle(), image.getFileType()));
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
nhấp để sao chép
đã sao chép
Nhiều ví dụ hơn Tài liệu

Các khả năng phân tích tài liệu khác

Ngoài việc trích xuất hình ảnh, GroupDocs.Parser còn cho phép bạn trích xuất nội dung thô như văn bản, liên kết, siêu dữ liệu, và dữ liệu có cấu trúc để xử lý và phân tích.

Trích xuất hình ảnh và nội dung từ các tài liệu

Hoạt động với nhiều định dạng khác nhau

Trích xuất hình ảnh từ các loại tài liệu khác nhau bao gồm PDF, DOCX, PPTX, XLSX và các định dạng hình ảnh như PNG, JPEG và GIF.

Bảo tồn độ rõ nét và độ phân giải của hình ảnh

Tất cả hình ảnh được trích xuất giữ nguyên độ phân giải và kiểu tệp gốc để đảm bảo chất lượng và khả năng sử dụng nhất quán.

Tùy chọn cấu hình linh hoạt

Tùy chỉnh quy trình trích xuất hình ảnh bằng cách lọc hình ảnh theo loại, kích thước, chỉ số trang hoặc định dạng tệp.

Trích xuất và lưu hình ảnh từ tệp PDF

Ví dụ này cho thấy cách trích xuất hình ảnh từ một tài liệu PDF và lưu chúng riêng lẻ trên thiết bị của bạn.

Java

//  Sử dụng Parser để mở tệp PDF
try (Parser parser = new Parser("input.pdf"))
{
    // Lấy hình ảnh từ nội dung tài liệu
    Iterable<PageImageArea> images = parser.getImages();

    // Đặt các tham số đầu ra như định dạng (ví dụ: JPEG hoặc PNG)
    ImageOptions options = new ImageOptions(ImageFormat.Png);

    // Lưu hình ảnh đã trích xuất vào một thư mục cục bộ
    int imageNumber = 0;
    for (PageImageArea image : images)
    {
        image.save(Constants.getOutputFilePath(String.format("%d.png", imageNumber)), options);
        imageNumber++;
    }
}

GroupDocs.Parser for Java là gì?

GroupDocs.Parser là một API phân tích đầy đủ tính năng được thiết kế dành cho các nhà phát triển Java. Nó cho phép trích xuất hình ảnh, văn bản, liên kết và các thành phần có cấu trúc từ nhiều định dạng tệp khác nhau bao gồm DOCX, XLSX, PDF, PNG, JPG và nhiều định dạng khác — tất cả mà không cần thư viện hoặc ứng dụng bên ngoài.
Tìm hiểu thêm
About illustration

Sẵn sàng để bắt đầu?

Tải xuống GroupDocs.Parser miễn phí hoặc nhận giấy phép dùng thử để có toàn quyền truy cập!

Tài nguyên hữu ích

Khám phá tài liệu, mẫu mã và hỗ trợ cộng đồng để nâng cao trải nghiệm của bạn.

Các loại tệp hỗ trợ trích xuất hình ảnh

GroupDocs.Parser hỗ trợ trích xuất hình ảnh từ nhiều tài liệu và hình ảnh khác nhau. Khám phá các định dạng thường được hỗ trợ dưới đây.

Lời khuyên về giấy phép tạm thời

1
Đăng ký bằng email công việc của bạn. Dịch vụ thư miễn phí không được phép.
2
Sử dụng nút Nhận giấy phép tạm thời ở Bước thứ hai.
 Tiếng Việt