GroupDocs.Parser for Java — это API для извлечения текста, изображений и метаданных, поддерживающий более 50 популярных типов документов, помогающий создавать бизнес-приложения с функциями парсинга необработанных данных. , структурированный и форматированный текст. Он также поддерживает анализ документов с использованием предопределенных шаблонов и позволяет быстро и точно извлекать сложные данные из счетов-фактур и других типичных документов. GroupDocs.Parser для Java позволяет извлекать текст и метаданные из защищенных паролем файлов всех популярных форматов, включая документы обработки текста, электронные таблицы Excel, презентации PowerPoint, файлы OneNote, PDF и ZIP-архивы.
GroupDocs.Parser API — правильный выбор для корпоративных решений, которым требуется функция извлечения текста из файлов. Эти API хорошо поддерживаются во всех основных операционных системах и платформах, включая Java runtime: J2SE 6.0 and above.
GroupDocs.Parser for Java позволяет разработчикам Java легко извлекать текст из файла ODT, реализуя несколько простых шаги.
// Извлечь текст из файла ODT с помощью API GroupDocs.Parser
// Создайте экземпляр класса Parser
try (Parser parser = new Parser(filePath)) {
// Извлечь текст в ридер
try (TextReader reader = parser.getText()) {
// Распечатать текст из документа
// Если извлечение текста не поддерживается, средство чтения недействительно.
System.out.println(reader == null ? "Извлечение текста не поддерживается" : reader.readToEnd());
}
}
GroupDocs.Parser for Java API поддерживаются на всех основных платформах и операционных системах. Перед выполнением приведенного ниже кода убедитесь, что в вашей системе установлены следующие предварительные компоненты.
Извлеките текст из файла ODT прямо сейчас, посетив веб-сайт GroupDocs.Parser Live Demos. Живая демонстрация имеет следующие преимущества.
Нет необходимости скачивать API
Нет необходимости писать код
Просто загрузите исходный файл
Скачать результирующий файл
Java API анализа документов и извлечения текста для форматов файлов и изображений. Извлеките данные для некоторых популярных форматов файлов, как указано ниже.
(Шаблон графика происхождения)
(Открыть шаблон документа)
(Портативный документ)
(Слайд-шоу Microsoft PowerPoint)
(Слайд-шоу PowerPoint Open XML)
(Презентация PowerPoint)
(Презентация PowerPoint Open XML)
(Расширенный текстовый формат файла)
(Исходный документ LaTeX)
(Формат файла чертежа Microsoft Visio XML)
(Рисование Visio с поддержкой макросов)
(Формат файла Microsoft Visio)
(Формат файла с поддержкой макросов Microsoft Visio)
(Формат файла трафарета Visio)
(Шаблон чертежа Visio с поддержкой макросов)
(Формат файла Microsoft Visio)