Как извлечь штрих-коды из PDF, DOCX, PPTX, EML, MSG, XLSX и EPUB через C# API

GroupDocs.Parser for .NET API позволяет разработчикам программного обеспечения извлекать штрих-коды из PDF, Word (DOC, DOCX), Excel (XLS, XLSX), PowerPoint (PPT, PPTX), Outlook (EML, MSG) и многих других документов.


Скачать бесплатную пробную версию

Как извлечь штрих-коды из Excel, Word, PDF и других документов API .NET?

Штрих-коды представляют собой машиночитаемое представление цифр и символов, которые широко используются во всем мире во многих контекстах, таких как извлечение и идентификация продуктов, отслеживание автомобильных запчастей, управление запасами и т. д. GroupDocs.Parser for .NET — это мощный API, который помогает разработчикам разрабатывать решения для извлечения текста, изображений и штрих-кодов из различных типов поддерживаемых форматов документов, таких как PDF, электронные письма, электронные книги, форматы Microsoft Office: Word (DOC, DOCX) , PowerPoint (PPT, PPTX), Excel (XLS, XLSX), электронные письма (EML, MSG) и многие другие форматы. API .NET включает поддержку нескольких расширенных функций анализа документов, таких как поиск текста по ключевым словам, точное извлечение текста, извлечение текста в формате HTML или Markdown, извлечение текстовых областей с координатами, извлечение метаданных или штрих-кодов и т. д.

Извлечь штрих-коды с документов в .NET

GroupDocs.Parser for .NET позволяет разработчикам C# извлекать штрих-коды из документов, выполняя несколько простых шагов.

  • Создать объект Parser для исходного документа;
  • Проверьте, поддерживает ли файл извлечение штрих-кода;
  • Вызовите метод GetBarcodes и получите коллекцию PageBarcodeArea объектов;
  • Переберите коллекцию и получите значение штрих-кода.

Как извлекать штрих-коды с документов с помощью примера кода C#

// Извлекать штрих-коды с документов с помощью API GroupDocs.Parser
// Создайте экземпляр класса Parser
using (Parser parser = new Parser(Constants.SamplePdfWithBarcodes)) {
    // Проверьте, поддерживает ли файл извлечение штрих-кода.
    if (!parser.Features.Barcodes) {
        Console.WriteLine("Файл не поддерживает извлечение штрих-кода.");
        return;
    }

    // Извлекайте штрих-коды из файла.
    IEnumerable<PageBarcodeArea> barcodes = parser.GetBarcodes();

    // Итерация по штрих-кодам
    foreach (PageBarcodeArea barcode in barcodes) {
        // Распечатать индекс страницы
        Console.WriteLine("Page: " + barcode.Page.Index.ToString());
        // Распечатать значение штрих-кода
        Console.WriteLine("Value: " + barcode.Value);
    }
}

Системные Требования

GroupDocs.Parser for .NET API поддерживаются на всех основных платформах и операционных системах. Перед выполнением приведенного ниже кода убедитесь, что в вашей системе установлены следующие предварительные компоненты.

  • Операционные системы: Microsoft Windows, Linux, MacOS
  • Среды разработки: Microsoft Visual Studio, Xamarin, MonoDevelop
  • Фреймворки
  • Загрузите последнюю версию GroupDocs.Parser for .NET из Nuget

Зачем использовать GroupDocs.Parser for .NET

  • Поддержка извлечения простого текста из любых поддерживаемых документов
  • Парсинг документов по пользовательским шаблонам
  • Полная поддержка извлечения структурированного текста
  • Текстовый поиск по ключевому слову и регулярному выражению
  • Извлечение форматированного текста, метаданных, изображений, контейнеров и вложений
  • Извлечение оглавления для некоторых поддерживаемых форматов документов
  • Парсинг данных форм из PDF-документов
  • Извлечение гиперссылок из документа

Живые демонстрации - извлечение штрих-кодов из документов онлайн

Извлекайте штрих-коды с документов прямо сейчас, посетив веб-сайт GroupDocs.Parser Live Demos. Живая демонстрация имеет следующие преимущества.

Нет необходимости скачивать API

Нет необходимости писать код

Просто загрузите исходный файл

Скачать результирующий файл

Извлечение штрих-кодов из других форматов документов

.NET API анализа документов и извлечения штрих-кодов для форматов файлов и изображений. Извлеките данные для некоторых популярных форматов файлов, как указано ниже.

DOC

(Документ Microsoft Word)

DOCM

(Документ Microsoft Word с поддержкой макросов)

DOCX

(Документ Microsoft Word с открытым XML)

DOT

(Шаблон документа Microsoft Word)

DOTM

(Шаблон Microsoft Word с поддержкой макросов)

DOTX

(Шаблон документа Word Open XML)

EPUB

(Формат файла цифровой электронной книги)

HTML

(Язык гипертекстовой разметки)

MHT

(MIME-инкапсуляция совокупного HTML)

MHTML

(MIME-инкапсуляция совокупного HTML)

ODP

(Формат файла презентации OpenDocument)

ODS

(Открыть электронную таблицу документов)

ODT

(Открыть текст документа)

ONE

(Формат файла Microsoft OneNote)

OTP

(Шаблон графика происхождения)

OTT

(Открыть шаблон документа)

PDF

(Портативный документ)

Back to top
 Русский