GroupDocs.Parser на перший погляд

API для виконання обробки документів у застосунках .NET

Illustration parser

Витяг даних з документів

GroupDocs.Parser for .NET API дозволяє вам отримувати текст, метадані та зображення з широкого спектра форматів файлів, таких як офісні документи, електронні пошти, вкладення та архіви. Цей потужний інструмент допомагає ефективно отримувати та обробляти цінну інформацію, що міститься в цих файлах для різних застосувань, таких як аналіз даних, індексація пошукових систем або системи керування контентом.

Парсинг документів

Витягуйте різні елементи, такі як гіперпосилання, таблиці, QR-коди, штрих-коди та дані з PDF форм. Також витягуйте будь-яку необхідну інформацію з документів, використовуючи власні шаблони.

Налаштування результатів

.NET API дозволяє вам отримувати дані у різних форматах, таких як сирий, структурований, HTML або Markdown. Додатково, API пропонує функцію пошуку для знаходження конкретних слів або фраз у тексті документів.

Незалежність платформи

GroupDocs.Parser for .NET підтримує наступні операційні системи, фреймворки та менеджери пакетів.

Amazon
Docker
Azure
VS Code
ReSharper
macOS
Linux
NuGet

Підтримувані формати файлів

GroupDocs.Parser for .NET підтримує операції з наступними форматами файлів.

Формати Microsoft Office

  • Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
  • Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

Зображення та інші формати

  • Портативні: PDF
  • Зображення: JPG, BMP, PNG, TIFF, GIF
  • Інші офісні формати: ODT, OTT, OTS, ODS, ODP, OTP, ODG

Інші формати

  • Веб: HTML, MHTML
  • Архіви: ZIP, TAR, 7Z
  • e-Books: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for .NET функції

Витягуйте дані з PDF, офісних документів та зображень швидко та точно

Feature icon

Витяг тексту

Витягуйте текстову інформацію з різних форматів файлів, таких як офісні документи, PDF файли та зображення для зручного читання та аналізу.

Feature icon

Витяг зображень

Отримуйте візуальний контент з різних джерел, таких як офісні документи, PDF файли для зручного доступу та використання.

Feature icon

Сканування QR кодів

Визначайте та декодуйте QR коди, що присутні в офісних документах, PDF файлах або візуальному контенті для ефективного отримання інформації.

Feature icon

Витяг даних з вкладень електронної пошти та архівів

Збирайте цінну інформацію з електронних листів, вкладень файлів та стиснених джерел даних для ефективного аналізу та використання.

Feature icon

Витяг таблиць

Визначайте та витягуйте табличні дані з PDF документів для організованого аналізу та використання.

Feature icon

Витяг гіперпосилань

Знаходьте та витягуйте гіперпосилання та адреси електронної пошти в офісних документах або PDF файлах для ефективного доступу.

Feature icon

Обробка PDF форм

PDF форми — це цифрові документи з заповнювальними полями для взаємодії з користувачем, що дозволяє йому вводити інформацію електронно. API .NET може бути використано для витягання даних з цих форм для ефективної обробки.

Feature icon

Парсинг даних за шаблонами

Створюйте власні шаблони та використовуйте їх з API .NET для парсингу специфічної інформації з PDF файлів, спрощуючи процеси витягання даних.

Feature icon

Пошук тексту в документах

Швидко знаходьте конкретні слова чи зразки в документах.

Приклади коду

Декілька випадків використання типових операцій GroupDocs.Parser for .NET

Витягни зображення з PDF документів

GroupDocs.Parser for .NET спрощує зображення для розробників C# для витягання зображень з документів:

Витягнути зображення з PDF документів на C#

// Створіть екземпляр класу Parser
using (var parser = new Parser("source.pptx"))
{
    // Витягніть зображення
    var images = parser.GetImages();

    // Перевірте, чи щось витягнуто
    if (images == null)
    {
        return;
    }
    // Ітеруйте по зображеннях
    foreach (PageImageArea image in images)
    {
        // Друкуйте індекс сторінки, прямокутник та тип зображення
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}

Витяг штрих-кодів з зображень

Використовуйте наш .NET API для витягання штрих-кодів з зображень:

Витягнути штрих-коди з зображень на C#

// Завантажте вихідне зображення в Parser
using (var parser = new Parser("source.jpg"))
{
    // Перевірте, чи підтримує файл витягнення штрих-кодів
    if (parser.Features.Barcodes)
    {
        // Витягніть штрих-коди з файлу
        var barcodes = parser.GetBarcodes();

        // Ітеруйте по штрих-кодах
        foreach (var barcode in barcodes)
        {
            // Друкуйте індекс сторінки
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // Друкуйте значення штрих-коду
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

Готові почати?

Завантажте GroupDocs.Parser безкоштовно або отримайте пробну ліцензію для повного доступу!

Корисні ресурси

Вивчіть документацію, зразки коду та підтримку спільноти для покращення вашого досвіду.

Поради щодо тимчасової ліцензії

1
Зареєструйтеся за допомогою вашої робочої e-mail. Безкоштовні поштові служби заборонені.
2
Скористайтеся кнопкою Отримати тимчасову ліцензію на другому кроці.
 Українська