GroupDocs.Parser for .NET

Извлечение изображений из ODP с использованием C#

Определите и извлеките встроенные изображения из PDF, документов Word, таблиц Excel и других типов файлов с помощью GroupDocs.Parser в ваших приложениях .NET.

Шаги для извлечения изображений из Odp в C#

С GroupDocs.Parser вы можете извлекать изображения из документов ODP в ваших проектах .NET всего за несколько шагов:

  1. Инициализируйте Parser с файлом ODP.
  2. Извлеките элементы изображений из документа.
  3. Используйте извлеченные изображения по мере необходимости в вашем рабочем процессе.
// Откройте документ, содержащий изображения, с помощью Parser
using (Parser parser = new Parser("input.odp")) {

    // Извлеките все встроенные изображения из файла
    IEnumerable<PageImageArea> images = parser.GetImages();

    // Обработайте случаи, когда изображения не найдены
    if (images == null)
    {
        return;
    }

    // Обработайте или сохраните полученные изображения
    foreach (PageImageArea image in images)
    {
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}
dotnet add package GroupDocs.Parser
Нажмите для копирования
Скопировано
Больше примеров Документация

Комплексное извлечение содержания документов

GroupDocs.Parser предлагает больше, чем просто извлечение изображений — вы также можете извлекать необработанный текст, гиперссылки, метаданные и структурированное содержимое для расширенных сценариев автоматизации.

Рабочий процесс извлечения изображений и парсинга документов

Извлечение изображений из нескольких форматов

Извлекайте встроенные изображения из различных форматов файлов, включая DOCX, PDF, PPTX, XLSX и графические файлы, такие как PNG, JPG и TIFF.

Сохранение оригинального качества изображений

Изображения извлекаются с высокой точностью, сохраняя их оригинальное разрешение, формат и цветовой профиль.

Расширенные параметры извлечения

Настройте извлечение изображений, фильтруя по странице, формату или разрешению, а также поддерживайте многополосные документы.

Как извлечь и сохранить изображения из документа PDF

Этот пример демонстрирует, как извлечь все изображения из файла PDF и сохранить их в локальной файловой системе.

C#

//  Загрузите PDF с помощью класса Parser
using (Parser parser = new Parser("input.pdf"))
{
    // Извлеките встроенные изображения из файла
    IEnumerable<PageImageArea> images = parser.GetImages();

    // Установите формат вывода и параметры изображений (например, PNG)
    ImageOptions options = new ImageOptions(ImageFormat.Png);

    // Запишите извлеченные изображения на диск
    int imageNumber = 0;
    foreach (PageImageArea image in images)
    {
        image.Save(imageNumber.ToString() + ".png", options);
        imageNumber++;
    }
}

О API GroupDocs.Parser for .NET

GroupDocs.Parser — это мощная библиотека для парсинга документов для разработчиков .NET. Она позволяет извлекать изображения, текст, гиперссылки и структурированные данные из популярных форматов файлов, таких как PDF, DOCX, XLSX, PPTX и других, без необходимости в сторонних приложениях.
Узнать больше
About illustration

Готовы начать?

Загрузите GroupDocs.Parser бесплатно или получите пробную лицензию для полного доступа!

Полезные ресурсы

Изучите документацию, примеры кода и раздел поддержки, чтобы улучшить ваш опыт.

Поддерживаемые форматы для извлечения изображений

GroupDocs.Parser обеспечивает точное извлечение изображений из широкого спектра документальных и графических форматов. Посмотрите ниже список часто поддерживаемых типов.

Советы по временной лицензии

1
Зарегистрируйтесь, используя ваш рабочий e-mail адрес. Бесплатные почтовые сервисы запрещены.
2
Используйте кнопку Получить временную лицензию на втором шаге.
 Русский