GroupDocs.Parser for Java — это API для извлечения текста, изображений и метаданных, поддерживающий более 50 популярных типов документов, помогающий создавать бизнес-приложения с функциями парсинга необработанных данных. , структурированный и форматированный текст. Он также поддерживает анализ документов с использованием предопределенных шаблонов и позволяет быстро и точно извлекать сложные данные из счетов-фактур и других типичных документов. GroupDocs.Parser для Java позволяет извлекать текст и метаданные из защищенных паролем файлов всех популярных форматов, включая документы обработки текста, электронные таблицы Excel, презентации PowerPoint, файлы OneNote, PDF и ZIP-архивы.
GroupDocs.Parser API — правильный выбор для корпоративных решений, которым требуется функция извлечения текста из файлов. Эти API хорошо поддерживаются во всех основных операционных системах и платформах, включая Java runtime: J2SE 6.0 and above.
GroupDocs.Parser for Java позволяет разработчикам Java легко извлекать текст из файла PPT, реализуя несколько простых шаги.
// Извлечь текст из файла PPT с помощью API GroupDocs.Parser
// Создайте экземпляр класса Parser
try (Parser parser = new Parser(filePath)) {
// Извлечь текст в ридер
try (TextReader reader = parser.getText()) {
// Распечатать текст из документа
// Если извлечение текста не поддерживается, средство чтения недействительно.
System.out.println(reader == null ? "Извлечение текста не поддерживается" : reader.readToEnd());
}
}
GroupDocs.Parser for Java API поддерживаются на всех основных платформах и операционных системах. Перед выполнением приведенного ниже кода убедитесь, что в вашей системе установлены следующие предварительные компоненты.
Извлеките текст из файла PPT прямо сейчас, посетив веб-сайт GroupDocs.Parser Live Demos. Живая демонстрация имеет следующие преимущества.
Нет необходимости скачивать API
Нет необходимости писать код
Просто загрузите исходный файл
Скачать результирующий файл
Java API анализа документов и извлечения текста для форматов файлов и изображений. Извлеките данные для некоторых популярных форматов файлов, как указано ниже.
(Исходный документ LaTeX)
(Формат файла чертежа Microsoft Visio XML)
(Рисование Visio с поддержкой макросов)
(Формат файла Microsoft Visio)
(Формат файла с поддержкой макросов Microsoft Visio)
(Формат файла трафарета Visio)
(Шаблон чертежа Visio с поддержкой макросов)
(Формат файла Microsoft Visio)
(Векторное скалярное расширение)
(Шаблон чертежа Microsoft Visio)
(Надстройка Microsoft Excel с поддержкой макросов)
(Формат двоичного файла Microsoft Excel)
(Двоичный файл электронной таблицы Microsoft Excel)
(Электронная таблица Microsoft Excel с поддержкой макросов)
(Электронная таблица Microsoft Excel Open XML)
(Шаблон Microsoft Excel)