GroupDocs.Parser for .NET

Извлечение изображений из ODP с использованием C#

Определите и извлеките встроенные изображения из PDF, документов Word, таблиц Excel и других типов файлов с помощью GroupDocs.Parser в ваших приложениях .NET.

Загрузка NuGet

Бесплатная пробная версия

Шаги для извлечения изображений из Odp в C#

С GroupDocs.Parser вы можете извлекать изображения из документов ODP в ваших проектах .NET всего за несколько шагов:

Инициализируйте Parser с файлом ODP.
Извлеките элементы изображений из документа.
Используйте извлеченные изображения по мере необходимости в вашем рабочем процессе.

Копировать

// Откройте документ, содержащий изображения, с помощью Parser
using (Parser parser = new Parser("input.odp")) {

    // Извлеките все встроенные изображения из файла
    IEnumerable<PageImageArea> images = parser.GetImages();

    // Обработайте случаи, когда изображения не найдены
    if (images == null)
    {
        return;
    }

    // Обработайте или сохраните полученные изображения
    foreach (PageImageArea image in images)
    {
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}

dotnet add package GroupDocs.Parser

Нажмите для копирования

Скопировано

Больше примеров Документация

Комплексное извлечение содержания документов

GroupDocs.Parser предлагает больше, чем просто извлечение изображений — вы также можете извлекать необработанный текст, гиперссылки, метаданные и структурированное содержимое для расширенных сценариев автоматизации.

Рабочий процесс извлечения изображений и парсинга документов

Извлечение изображений из нескольких форматов

Извлекайте встроенные изображения из различных форматов файлов, включая DOCX, PDF, PPTX, XLSX и графические файлы, такие как PNG, JPG и TIFF.

Сохранение оригинального качества изображений

Изображения извлекаются с высокой точностью, сохраняя их оригинальное разрешение, формат и цветовой профиль.

Расширенные параметры извлечения

Настройте извлечение изображений, фильтруя по странице, формату или разрешению, а также поддерживайте многополосные документы.

Как извлечь и сохранить изображения из документа PDF

Этот пример демонстрирует, как извлечь все изображения из файла PDF и сохранить их в локальной файловой системе.

C#

//  Загрузите PDF с помощью класса Parser
using (Parser parser = new Parser("input.pdf"))
{
    // Извлеките встроенные изображения из файла
    IEnumerable<PageImageArea> images = parser.GetImages();

    // Установите формат вывода и параметры изображений (например, PNG)
    ImageOptions options = new ImageOptions(ImageFormat.Png);

    // Запишите извлеченные изображения на диск
    int imageNumber = 0;
    foreach (PageImageArea image in images)
    {
        image.Save(imageNumber.ToString() + ".png", options);
        imageNumber++;
    }
}

О API GroupDocs.Parser for .NET

GroupDocs.Parser — это мощная библиотека для парсинга документов для разработчиков .NET. Она позволяет извлекать изображения, текст, гиперссылки и структурированные данные из популярных форматов файлов, таких как PDF, DOCX, XLSX, PPTX и других, без необходимости в сторонних приложениях.

Узнать больше

Готовы начать?

Загрузите GroupDocs.Parser бесплатно или получите пробную лицензию для полного доступа!

Загрузка NuGet

Бесплатная пробная версия

Полезные ресурсы

Изучите документацию, примеры кода и раздел поддержки, чтобы улучшить ваш опыт.

Поддерживаемые форматы для извлечения изображений

GroupDocs.Parser обеспечивает точное извлечение изображений из широкого спектра документальных и графических форматов. Посмотрите ниже список часто поддерживаемых типов.

Парсинг PDF
(Формат переносимого документа)
Парсинг DOCX
(Документ Word 2007+)
Парсинг PPTX
(Формат презентации Open XML)
Парсинг XLSX
(Рабочая книга Open XML)
Парсинг ODT
(Текстовый документ OpenDocument)
Парсинг ODS
(Электронная таблица OpenDocument)
Парсинг EPUB
(Файл открытой электронной книги)
Парсинг FB2
(Электронная книга FictionBook)