GroupDocs.Parser в кратком изложении
API для парсинга документов в приложениях .NET
Извлечение данных из документов
GroupDocs.Parser for .NET API позволяет извлекать текст, метаданные и изображения из широкого диапазона форматов файлов, таких как офисные документы, электронные письма, вложения и архивы. Этот мощный инструмент помогает эффективно получать и обрабатывать ценные данные, содержащиеся в этих файлах для различных приложений, таких как анализ данных, индексация поисковых систем или системы управления контентом.
Парсинг документов
Извлечение различных элементов, таких как гиперссылки, таблицы, QR-коды, штрих-коды и данные из форм PDF. Также можно парсить любую необходимую информацию из документов с помощью пользовательских шаблонов.
Настройка результатов
.NET API позволяет извлекать данные в различных форматах, таких как необработанные, структурированные, HTML или Markdown. Дополнительно API предлагает функциональность поиска для нахождения конкретных слов или фраз в тексте документов.