GroupDocs.Parser for .NET — это API извлечения текста, метаданных и изображений для бизнес-приложений, разработанных с использованием C#, ASP.NET и других технологий .NET. Он поддерживает извлечение необработанного, форматированного и структурированного текста, а также метаданных из файлов поддерживаемых форматов. С помощью GroupDocs.Parser для .NET ваши приложения также могут выполнять синтаксический анализ защищенных паролем документов для популярных форматов, таких как документы обработки Word, электронные таблицы Excel, презентации PowerPoint, файлы OneNote, PDF и ZIP-архивы.
GroupDocs.Parser API — правильный выбор для корпоративных решений, которым требуется функция извлечения текста из файлов. Эти API хорошо поддерживаются во всех основных операционных системах и платформах, включая Frameworks: .NET Framework, .NET Standard, .NET Core, Mono.
GroupDocs.Parser for .NET позволяет разработчикам C# легко извлекать текст из документов, выполняя несколько простых шагов.
// Извлечение текста из документов с помощью API GroupDocs.Parser
// Создайте экземпляр класса Parser
using (Parser parser = new Parser(filePath)) {
// Извлечь текст в ридер
using (TextReader reader = parser.GetText()) {
// Распечатать текст из документа
// Если извлечение текста не поддерживается, средство чтения недействительно.
Console.WriteLine(reader == null ? "Извлечение текста не поддерживается" : reader.ReadToEnd());
}
}
GroupDocs.Parser for .NET API поддерживаются на всех основных платформах и операционных системах. Перед выполнением приведенного ниже кода убедитесь, что в вашей системе установлены следующие предварительные компоненты.
Извлекайте текст из документов прямо сейчас, посетив веб-сайт GroupDocs.Parser Live Demos. Живая демонстрация имеет следующие преимущества.
Нет необходимости скачивать API
Нет необходимости писать код
Просто загрузите исходный файл
Скачать результирующий файл
.NET API анализа документов и извлечения текста для форматов файлов и изображений. Извлеките данные для некоторых популярных форматов файлов, как указано ниже.
(Документ Microsoft Word)
(Документ Microsoft Word с поддержкой макросов)
(Документ Microsoft Word с открытым XML)
(Шаблон документа Microsoft Word)
(Шаблон Microsoft Word с поддержкой макросов)
(Шаблон документа Word Open XML)
(Формат файла цифровой электронной книги)
(Язык гипертекстовой разметки)
(MIME-инкапсуляция совокупного HTML)
(MIME-инкапсуляция совокупного HTML)
(Формат файла презентации OpenDocument)
(Открыть электронную таблицу документов)
(Открыть текст документа)
(Формат файла Microsoft OneNote)
(Шаблон графика происхождения)
(Открыть шаблон документа)
(Портативный документ)