Как извлечь штрих-коды из DOT через Java API

GroupDocs.Parser for Java API позволяет разработчикам программного обеспечения извлекать штрих-коды из DOT и многих других документов.


Скачать бесплатную пробную версию

Как извлечь штрих-коды из DOT файлов Java API?

Штрих-коды представляют собой машиночитаемое представление цифр и символов, которые широко используются во всем мире во многих контекстах, таких как извлечение и идентификация продуктов, отслеживание автомобильных запчастей, управление запасами и т. д. GroupDocs.Parser for Java — это мощный API, который помогает разработчикам разрабатывать решения для извлечения текста, изображений и штрих-кодов из различных типов поддерживаемых форматов документов, таких как PDF, электронные письма, электронные книги, форматы Microsoft Office: Word (DOC, DOCX) , PowerPoint (PPT, PPTX), Excel (XLS, XLSX), электронные письма (EML, MSG) и многие другие форматы. API Java включает поддержку нескольких расширенных функций анализа документов, таких как поиск текста по ключевым словам, точное извлечение текста, извлечение текста в формате HTML или Markdown, извлечение текстовых областей с координатами, извлечение метаданных или штрих-кодов и т. д.

Извлечь штрих-коды из DOT в Java

GroupDocs.Parser for Java позволяет разработчикам Java извлечь штрих-коды из файла DOT, выполняя несколько простых шагов. .

  • Создать объект Parser для исходного документа;
  • Проверьте, поддерживает ли файл извлечение штрих-кода;
  • Вызовите метод getBarcodes и получите коллекцию PageBarcodeArea объектов;
  • Переберите коллекцию и получите значение штрих-кода.

Как извлечь штрих-коды из файла DOT, используя пример кода Java

// Извлечь штрих-коды из файла DOT с помощью API GroupDocs.Parser
// Создайте экземпляр класса Parser
try (Parser parser = new Parser(Constants.SamplePdfWithBarcodes)) {
    // // Проверьте, поддерживает ли файл извлечение штрих-кода.
    if (!parser.getFeatures().isBarcodes()) {
        System.out.println("Файл не поддерживает извлечение штрих-кода.");
        return;
    }

    // Извлекайте штрих-коды из файла.
    Iterable<PageBarcodeArea> barcodes = parser.getBarcodes();

    // Итерация по штрих-кодам
    for (PageBarcodeArea barcode : barcodes) {
        // Распечатать индекс страницы
        System.out.println("Page: " + barcode.getPage().getIndex());
        // Распечатать значение штрих-кода
        System.out.println("Value: " + barcode.getValue());
    }
}

Системные Требования

GroupDocs.Parser for Java API поддерживаются на всех основных платформах и операционных системах. Перед выполнением приведенного ниже кода убедитесь, что в вашей системе установлены следующие предварительные компоненты.

  • Операционные системы: Microsoft Windows, Linux, MacOS
  • Среды разработки: NetBeans, Intellij IDEA, Eclipse, etc.
  • Фреймворки
  • Загрузите последнюю версию GroupDocs.Parser for Java из Maven

Зачем использовать GroupDocs.Parser for Java

  • Поддержка извлечения простого текста из любых поддерживаемых документов
  • Парсинг документов по пользовательским шаблонам
  • Полная поддержка извлечения структурированного текста
  • Текстовый поиск по ключевому слову и регулярному выражению
  • Извлечение форматированного текста, метаданных, изображений, контейнеров и вложений
  • Извлечение оглавления для некоторых поддерживаемых форматов документов
  • Парсинг данных форм из PDF-документов
  • Извлечение гиперссылок из документа

Демонстрации в реальном времени — извлечение штрих-кодов из DOT в Интернете

Извлекайте штрих-коды из файла DOT прямо сейчас, посетив веб-сайт GroupDocs.Parser Live Demos. Живая демонстрация имеет следующие преимущества.

Нет необходимости скачивать API

Нет необходимости писать код

Просто загрузите исходный файл

Скачать результирующий файл

Извлечение штрих-кодов из других форматов документов

Java API анализа документов и извлечения штрих-кодов для форматов файлов и изображений. Извлеките данные для некоторых популярных форматов файлов, как указано ниже.

DOTM

(Шаблон Microsoft Word с поддержкой макросов)

DOTX

(Шаблон документа Word Open XML)

EPUB

(Формат файла цифровой электронной книги)

HTML

(Язык гипертекстовой разметки)

MHT

(MIME-инкапсуляция совокупного HTML)

MHTML

(MIME-инкапсуляция совокупного HTML)

ODP

(Формат файла презентации OpenDocument)

ODS

(Открыть электронную таблицу документов)

ODT

(Открыть текст документа)

ONE

(Формат файла Microsoft OneNote)

OTP

(Шаблон графика происхождения)

OTT

(Открыть шаблон документа)

PDF

(Портативный документ)

PPS

(Слайд-шоу Microsoft PowerPoint)

PPSX

(Слайд-шоу PowerPoint Open XML)

PPT

(Презентация PowerPoint)

Back to top
 Русский