GroupDocs.Parser for .NET

Trích xuất hình ảnh từ ODP sử dụng C#

Xác định và trích xuất hình ảnh nhúng từ các tệp PDF, tài liệu Word, trang tính Excel và các loại tệp khác bằng GroupDocs.Parser trong các ứng dụng .NET của bạn.

Các bước để trích xuất hình ảnh từ Odp trong C#

Với GroupDocs.Parser, bạn có thể trích xuất hình ảnh từ tài liệu ODP trong các dự án .NET của bạn chỉ trong vài bước:

  1. Khởi tạo Parser với tệp ODP.
  2. Lấy các phần tử hình ảnh từ tài liệu.
  3. Sử dụng các hình ảnh đã trích xuất theo nhu cầu trong quy trình làm việc của bạn.
// Mở tài liệu chứa hình ảnh bằng Parser
using (Parser parser = new Parser("input.odp")) {

    // Trích xuất tất cả hình ảnh nhúng từ tệp
    IEnumerable<PageImageArea> images = parser.GetImages();

    // Xử lý các trường hợp không có hình ảnh được tìm thấy
    if (images == null)
    {
        return;
    }

    // Xử lý hoặc lưu hình ảnh đã thu được
    foreach (PageImageArea image in images)
    {
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}
dotnet add package GroupDocs.Parser
nhấp để sao chép
đã sao chép
Nhiều ví dụ hơn Tài liệu

Trích xuất nội dung tài liệu toàn diện

GroupDocs.Parser cung cấp nhiều hơn cả việc trích xuất hình ảnh — bạn cũng có thể trích xuất văn bản thô, liên kết, siêu dữ liệu và nội dung có cấu trúc cho các kịch bản tự động hóa nâng cao.

Quy trình làm việc trích xuất hình ảnh và phân tích tài liệu

Trích xuất hình ảnh từ nhiều định dạng

Trích xuất hình ảnh nhúng từ nhiều định dạng tệp, bao gồm DOCX, PDF, PPTX, XLSX và các tệp hình ảnh như PNG, JPG và TIFF.

Giữ nguyên chất lượng hình ảnh gốc

Hình ảnh được trích xuất với độ trung thực cao, giữ nguyên độ phân giải, định dạng và hồ sơ màu sắc gốc.

Tùy chọn trích xuất nâng cao

Tùy chỉnh việc trích xuất hình ảnh với lọc theo trang, định dạng hoặc độ phân giải, và hỗ trợ cho các tài liệu nhiều trang.

Cách trích xuất và lưu hình ảnh từ tài liệu PDF

Ví dụ này minh họa cách trích xuất tất cả tài sản hình ảnh từ một tệp PDF và lưu chúng vào hệ thống tệp cục bộ.

C#

//  Tải tệp PDF bằng lớp Parser
using (Parser parser = new Parser("input.pdf"))
{
    // Trích xuất hình ảnh nhúng từ tệp
    IEnumerable<PageImageArea> images = parser.GetImages();

    // Đặt định dạng đầu ra và các tùy chọn hình ảnh (ví dụ: PNG)
    ImageOptions options = new ImageOptions(ImageFormat.Png);

    // Ghi các hình ảnh đã trích xuất vào đĩa
    int imageNumber = 0;
    foreach (PageImageArea image in images)
    {
        image.Save(imageNumber.ToString() + ".png", options);
        imageNumber++;
    }
}

Giới thiệu về API GroupDocs.Parser for .NET

GroupDocs.Parser là một thư viện phân tích tài liệu mạnh mẽ dành cho các nhà phát triển .NET. Nó cho phép bạn trích xuất hình ảnh, văn bản, liên kết và dữ liệu có cấu trúc từ các định dạng tệp phổ biến như PDF, DOCX, XLSX, PPTX và các định dạng khác — tất cả đều không cần ứng dụng bên thứ ba.
Tìm hiểu thêm
About illustration

Sẵn sàng để bắt đầu?

Tải xuống GroupDocs.Parser miễn phí hoặc nhận giấy phép dùng thử để có toàn quyền truy cập!

Tài nguyên hữu ích

Khám phá tài liệu, mẫu mã và hỗ trợ cộng đồng để nâng cao trải nghiệm của bạn.

Định dạng được hỗ trợ cho việc trích xuất hình ảnh

GroupDocs.Parser cho phép trích xuất hình ảnh chính xác từ nhiều định dạng tài liệu và hình ảnh khác nhau. Kiểm tra danh sách dưới đây để biết các loại định dạng hỗ trợ phổ biến.

Lời khuyên về giấy phép tạm thời

1
Đăng ký bằng email công việc của bạn. Dịch vụ thư miễn phí không được phép.
2
Sử dụng nút Nhận giấy phép tạm thời ở Bước thứ hai.
 Tiếng Việt