GroupDocs.Parser for .NET — это API извлечения текста, метаданных и изображений для бизнес-приложений, разработанных с использованием C#, ASP.NET и других технологий .NET. Он поддерживает извлечение необработанного, форматированного и структурированного текста, а также метаданных из файлов поддерживаемых форматов. С помощью GroupDocs.Parser для .NET ваши приложения также могут выполнять синтаксический анализ защищенных паролем документов для популярных форматов, таких как документы обработки Word, электронные таблицы Excel, презентации PowerPoint, файлы OneNote, PDF и ZIP-архивы.
GroupDocs.Parser API — правильный выбор для корпоративных решений, которым требуется функция извлечения текста из файлов. Эти API хорошо поддерживаются во всех основных операционных системах и платформах, включая Frameworks: .NET Framework, .NET Standard, .NET Core, Mono.
GroupDocs.Parser for .NET позволяет разработчикам C# легко извлекать текст из файла PDF, реализуя несколько простых шаги.
// Извлечь текст из файла PDF с помощью API GroupDocs.Parser
// Создайте экземпляр класса Parser
using (Parser parser = new Parser(filePath)) {
// Извлечь текст в ридер
using (TextReader reader = parser.GetText()) {
// Распечатать текст из документа
// Если извлечение текста не поддерживается, средство чтения недействительно.
Console.WriteLine(reader == null ? "Извлечение текста не поддерживается" : reader.ReadToEnd());
}
}
GroupDocs.Parser for .NET API поддерживаются на всех основных платформах и операционных системах. Перед выполнением приведенного ниже кода убедитесь, что в вашей системе установлены следующие предварительные компоненты.
Извлеките текст из файла PDF прямо сейчас, посетив веб-сайт GroupDocs.Parser Live Demos. Живая демонстрация имеет следующие преимущества.
Нет необходимости скачивать API
Нет необходимости писать код
Просто загрузите исходный файл
Скачать результирующий файл
.NET API анализа документов и извлечения текста для форматов файлов и изображений. Извлеките данные для некоторых популярных форматов файлов, как указано ниже.
(Слайд-шоу PowerPoint Open XML)
(Презентация PowerPoint)
(Презентация PowerPoint Open XML)
(Расширенный текстовый формат файла)
(Исходный документ LaTeX)
(Формат файла чертежа Microsoft Visio XML)
(Рисование Visio с поддержкой макросов)
(Формат файла Microsoft Visio)
(Формат файла с поддержкой макросов Microsoft Visio)
(Формат файла трафарета Visio)
(Шаблон чертежа Visio с поддержкой макросов)
(Формат файла Microsoft Visio)
(Векторное скалярное расширение)
(Шаблон чертежа Microsoft Visio)
(Надстройка Microsoft Excel с поддержкой макросов)
(Формат двоичного файла Microsoft Excel)