GroupDocs.Parser for .NET

Парсинг документів PPTX з використанням C#

Ефективно витягуйте текст, метадані, таблиці та зображення з файлів PDF, Word, Excel та зображень за допомогою GroupDocs.Parser у ваших проектах .NET.

Кроки для витягування даних з Pptx у C#

Дотримуйтесь цих кроків, щоб парсити вміст з документів PPTX у ваших додатках .NET, використовуючи GroupDocs.Parser:

  1. Завантажте документ PPTX за допомогою екземпляра Parser.
  2. Витягніть необхідний вміст, наприклад, текст, таблиці або метадані.
  3. Перевірте, що витягнуті дані є дійсними.
  4. Використовуйте парсений output у ваших подальших процесах, автоматизації чи бізнес-системах.
// Завантажте ваш документ у Parser
using (Parser parser = new Parser("input.pptx")) {

    // Витягніть весь текстовий вміст з файлу
    using (TextReader reader = parser.GetText()) 
    {
        // Якщо текст недоступний, результатом буде null
        // Використовуйте витягнутий текст у вашій програмі
        Console.WriteLine(reader == null ? 
            "Витягування тексту не підтримується для цього формату" : reader.ReadToEnd());
    }
}
dotnet add package GroupDocs.Parser
натисніть, щоб скопіювати
скопійовано
Більше прикладів Документація

Комплексні можливості парсингу документів

GroupDocs.Parser забезпечує не лише читання тексту — він підтримує витягування штрих-кодів, парсинг зображень, доступ до метаданих та обробку структурованих даних для розширеної автоматизації та аналізу даних.

Можливості витягування та парсингу вмісту документів

Підтримка різноманітних типів вмісту файлів

Витягайте дані, включаючи текст, зображення, таблиці та поля з форматів документів, таких як PDF, Word, Excel, HTML та інших.

Працюйте як з відсканованими, так і з цифровими файлами

Парсіть дані з відсканованих документів та цифрових файлів однаково, з підтримкою OCR та витягуванням, що враховує макет.

Конфігуровані параметри витягування

Налаштуйте логіку парсингу за допомогою гнучких опцій, таких як вибір діапазону сторінок, націлювання на регіон та шаблони виявлення полів.

Як парсити PDF за допомогою шаблонів

Цей приклад показує, як витягти структуровані дані з PDF, використовуючи попередньо визначений шаблон парсингу з GroupDocs.Parser.

C#

//  Завантажте PDF файл за допомогою класу Parser
using (Parser parser = new Parser("input.pdf"))
{
    // Парсіть документ за шаблоном
    DocumentData data = parser.ParseByTemplate(GetTemplate());

    // Перевірте, чи підтримується витягування форм
    if (data == null)
    {
        return;
    }

    // Обробка отриманих полів
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}

private static Template GetTemplate()
{
    // Створіть параметри детектора для таблиці 'Деталі'
    TemplateTableParameters detailsTableParameters = 
        new TemplateTableParameters(new Rectangle(new Point(35, 320), new Size(530, 55)), null);

    TemplateItem[] templateItems = new TemplateItem[]
    {
        new TemplateTable(detailsTableParameters, "details", null)
    };

    Template template = new Template(templateItems);
    return template;
}

Про API GroupDocs.Parser for .NET

GroupDocs.Parser — це багатофункціональне API для парсингу документів, призначене для розробників .NET. Воно підтримує витягування простого та структурованого тексту, метаданих, зображень, таблиць та штрих-кодів з популярних форматів, таких як PDF, DOCX, XLSX, PPTX та інших — без необхідності в додаткових програмах.
Дізнатися більше
About illustration

Готові почати?

Завантажте GroupDocs.Parser безкоштовно або отримайте пробну ліцензію для повного доступу!

Корисні ресурси

Вивчіть документацію, зразки коду та підтримку спільноти для покращення вашого досвіду.

Підтримувані формати для витягування даних

GroupDocs.Parser дозволяє парсинг даних з широкого спектра документів та зображень. Ознайомтеся з підтримуваними типами файлів, які зазвичай використовуються в роботі з витягуванням даних.

Поради щодо тимчасової ліцензії

1
Зареєструйтеся за допомогою вашої робочої e-mail. Безкоштовні поштові служби заборонені.
2
Скористайтеся кнопкою Отримати тимчасову ліцензію на другому кроці.
 Українська