Надежный API для извлечения данных из различных форматов файлов.
Парсите документы с минимальными усилиями в кодировании.
Настраивайте результаты парсинга.
API для парсинга данных из PDF, Word, Excel и других форматов
Извлечение текстовой информации из различных форматов файлов
Получение визуального контента из различных источников
Создание пользовательских шаблонов и их использование для парсинга конкретной информации
PDF-формы - это цифровые документы с заполняемыми полями для взаимодействия с пользователем
Некоторые случаи использования типичных операций GroupDocs.Parser на C# и Java
// Создайте экземпляр класса Parser, передав нужный файл
using (var parser = new Parser("source.pdf"))
{
// Извлеките текст
using (var textReader = parser.GetText())
{
// Обработайте извлеченный текст
Console.WriteLine(textReader?.ReadToEnd());
}
}
// Создайте экземпляр класса Parser, передав нужный файл
try (Parser parser = new Parser("source.pdf"))
{
// Извлеките текст
try (TextReader reader = parser.getText())
{
// Обработайте извлеченный текст
System.out.println(reader == null
? ""
: reader.readToEnd());
}
}
GroupDocs.Parser позволяет выполнять операции парсинга в различных семействе форматов
Узнайте ключевые показатели успеха нашей библиотеки
GroupDocs.Parser поддерживает работу с более чем 50 популярными форматами файлов.
Пакет GroupDocs.Parser для .NET был скачан более 1,600,000 раз.
GroupDocs.Parser имеет 18,000 скачиваний на Maven. Мощные функции парсинга Java.
Известные компании и индивидуальные разработчики предпочитают продукты GroupDocs для создания инновационных решений.
Библиотеки GroupDocs используются всемирно известными и уважаемыми брендами.
Библиотека GroupDocs.Parser поддерживает следующие операционные системы и фреймворки:
Изучите документацию, примеры кода и раздел поддержки, чтобы улучшить ваш опыт.
Ответы на самые часто задаваемые вопросы.
Интегрируйте возможности парсинга документов в любое приложение, используя наш облачный REST API
Команды cURL для облачного API парсинга документов для обработки документов в широком диапазоне поддерживаемых популярных форматов файлов.
Извлеките изображения, текст, информацию о документах или даже проведите парсинг любого документа по определенному пользователем шаблону в ваших приложениях Microsoft .NET.
Облачный SDK для разработчиков Java для парсинга документов, извлечения информации и данных в приложениях на Java.
Веб-приложение, которое позволяет выполнять парсинг более чем 50 популярных форматов документов напрямую в вашем браузере.
Бесплатное онлайн приложение для парсинга Word, Excel, PowerPoint, PDF и более 50 типов документов.
Парсите документы Word напрямую из вашего веб-браузера, чтобы извлечь изображения, текст или метаданные.
Бесплатное приложение для парсинга PDF, которое работает на любой платформе или устройстве без каких-либо ограничений.