GroupDocs.Parser for Java

Отримайте дані таблиць з PPTX за допомогою Java

Безперешкодно виявляйте та витягуйте таблиці з форматів, таких як PDF, DOCX та XLSX, за допомогою GroupDocs.Parser у ваших робочих процесах Java.

Як отримати таблиці з Pptx у Java

Щоб проаналізувати таблиці з документів PPTX за допомогою GroupDocs.Parser, виконайте ці кроки у вашому середовищі Java:

  1. Створіть екземпляр Parser та завантажте цільовий файл PPTX.
  2. Переконайтеся, що файл підтримує структуроване витягання таблиць.
  3. Використовуйте API для отримання елементів таблиці з документа.
  4. Застосуйте витягнуті дані в аналітиці, звітності або автоматизаційних системах.
// Завантажте вхідний документ за допомогою Parser, який містить елементи таблиці
try (Parser parser = new Parser("input.pptx"))
{
    // Переконайтеся, що тип документа дозволяє виявлення таблиць
    if (!parser.getFeatures().isTables()) {
        System.out.println("Додайте логіку для файлів, що не підтримують таблиці");
        return;
    }

    // Визначте правила для інтерпретації структури таблиці
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Встановіть параметри для витягання таблиць
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Запустіть витягання таблиць з завантаженого документа
    Iterable<PageTableArea> tables = parser.getTables(options);

    //  Обробіть кожну витягнуту таблицю з результату
    for (PageTableArea t : tables) 
    {
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
натисніть, щоб скопіювати
скопійовано
Більше прикладів Документація

Розширені інструменти для витягання вмісту

Крім зчитування таблиць, GroupDocs.Parser підтримує захоплення простого тексту, візуальних елементів, вбудованих метаданих та структурованих об’єктів для покращення завдань обробки документів.

Витягування структурованого вмісту та табличних даних

Точне аналізування таблиць по різних форматах

Підтримка витягання таблиць з стандартних типів документів, таких як PDF, Word, Excel та HTML з високою точністю.

Зчитуйте табличні структури з різноманітних джерел

Отримуйте дані таблиць з електронних таблиць, документів та звітів, зберігаючи структуру та вирівнювання.

Налаштовувані параметри витягання таблиць

Контролюйте виявлення розмітки, керуйте заголовками та підписами, а також налаштовуйте витягання з гнучкими параметрами конфігурації.

Приклад: витягти таблиці з документа Excel

Цей приклад показує, як витягти та перебрати вміст таблиці в файлі Excel (XLSX) за допомогою GroupDocs.Parser.

Java

//  Ініціалізуйте Parser з файлом Excel
try (Parser parser = new Parser("input.pdf"))
{
    // Вийти, якщо витягнення таблиці не підтримується для цього документа
    if (!parser.getFeatures().isTables())
    {
        return;
    }

    // Застосуйте правила для знаходження макету таблиці
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Налаштуйте параметри для витягання таблиці
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // Запустіть процес витягання
    Iterable<PageTableArea> tables = parser.getTables(options);

    // Переберіть усі розібрані структури таблиць
    for (PageTableArea t : tables)
    {
        // Переберіть кожен рядок у таблиці
        for (int row = 0; row < t.getRowCount(); row++)
        {
            // Обробіть кожну клітину в поточному рядку
            for (int column = 0; column < t.getColumnCount(); column++) 
            {
                // Отримайте доступ і прочитайте вміст поточної клітини
                PageTableAreaCell cell = t.getCell(row, column);
                if (cell != null)
                {
                    // Виведіть текстове значення кожної клітини таблиці
                    System.out.print(cell.getText());
                    System.out.print(" | ");
                }
            }
        }
    }
}

Вступ до API GroupDocs.Parser for Java

GroupDocs.Parser — це багатофункціональний API для витягання вмісту для платформ Java. Він дозволяє розробникам точно аналізувати таблиці, текст, графіку, посилання та структуровані дані з PDF, документів Word, таблиць Excel, презентацій PowerPoint та багато іншого — без потреби у сторонніх плагінах.
Дізнатися більше
About illustration

Готові почати?

Завантажте GroupDocs.Parser безкоштовно або отримайте пробну ліцензію для повного доступу!

Корисні ресурси

Вивчіть документацію, зразки коду та підтримку спільноти для покращення вашого досвіду.

Типи документів, що підтримуються для витягання таблиць

GroupDocs.Parser забезпечує надійне виявлення таблиць у різних типах файлів. Ось список найбільш поширених форматів документів для витягання таблиць.

Поради щодо тимчасової ліцензії

1
Зареєструйтеся за допомогою вашої робочої e-mail. Безкоштовні поштові служби заборонені.
2
Скористайтеся кнопкою Отримати тимчасову ліцензію на другому кроці.
 Українська