GroupDocs.Parser for Java

Отримайте дані таблиць з PPTX за допомогою Java

Безперешкодно виявляйте та витягуйте таблиці з форматів, таких як PDF, DOCX та XLSX, за допомогою GroupDocs.Parser у ваших робочих процесах Java.

Завантажити Maven

Почніть безкоштовну пробну версію

Як отримати таблиці з Pptx у Java

Щоб проаналізувати таблиці з документів PPTX за допомогою GroupDocs.Parser, виконайте ці кроки у вашому середовищі Java:

Створіть екземпляр Parser та завантажте цільовий файл PPTX.
Переконайтеся, що файл підтримує структуроване витягання таблиць.
Використовуйте API для отримання елементів таблиці з документа.
Застосуйте витягнуті дані в аналітиці, звітності або автоматизаційних системах.

Копіювати

// Завантажте вхідний документ за допомогою Parser, який містить елементи таблиці
try (Parser parser = new Parser("input.pptx"))
{
    // Переконайтеся, що тип документа дозволяє виявлення таблиць
    if (!parser.getFeatures().isTables()) {
        System.out.println("Додайте логіку для файлів, що не підтримують таблиці");
        return;
    }

    // Визначте правила для інтерпретації структури таблиці
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Встановіть параметри для витягання таблиць
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Запустіть витягання таблиць з завантаженого документа
    Iterable<PageTableArea> tables = parser.getTables(options);

    //  Обробіть кожну витягнуту таблицю з результату
    for (PageTableArea t : tables) 
    {
    }
}

<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>24.9</version>
</dependency>
</dependencies>
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://repository.groupdocs.com/repo/</url>
</repository>
</repositories>

натисніть, щоб скопіювати

скопійовано

Більше прикладів Документація

Розширені інструменти для витягання вмісту

Крім зчитування таблиць, GroupDocs.Parser підтримує захоплення простого тексту, візуальних елементів, вбудованих метаданих та структурованих об’єктів для покращення завдань обробки документів.

Витягування структурованого вмісту та табличних даних

Точне аналізування таблиць по різних форматах

Підтримка витягання таблиць з стандартних типів документів, таких як PDF, Word, Excel та HTML з високою точністю.

Зчитуйте табличні структури з різноманітних джерел

Отримуйте дані таблиць з електронних таблиць, документів та звітів, зберігаючи структуру та вирівнювання.

Налаштовувані параметри витягання таблиць

Контролюйте виявлення розмітки, керуйте заголовками та підписами, а також налаштовуйте витягання з гнучкими параметрами конфігурації.

Приклад: витягти таблиці з документа Excel

Цей приклад показує,

як витягти та перебрати вміст таблиці в файлі Excel (XLSX) за допомогою GroupDocs.Parser.

Java

//  Ініціалізуйте Parser з файлом Excel style=color:#888;font-style:italic>try (Parser parser = new Parser("input.pdf")) { // Вийти, якщо витягнення таблиці не підтримується для цього документа style=color:#888;font-style:italic>    if (!parser.getFeatures().isTables()) { return; } // Застосуйте правила для знаходження макету таблиці style=color:#888;font-style:italic>    TemplateTableLayout layout = new TemplateTableLayout( java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}), java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0})); // Налаштуйте параметри для витягання таблиці style=color:#888;font-style:italic>    PageTableAreaOptions options = new PageTableAreaOptions(layout); // Запустіть процес витягання style=color:#888;font-style:italic>    Iterable<PageTableArea> tables = parser.getTables(options); // Переберіть усі розібрані структури таблиць style=color:#888;font-style:italic>    for (PageTableArea t : tables) { // Переберіть кожен рядок у таблиці style=color:#888;font-style:italic>        for (int row = 0; row < t.getRowCount(); row++) { // Обробіть кожну клітину в поточному рядку style=color:#888;font-style:italic>            for (int column = 0; column < t.getColumnCount(); column++) { // Отримайте доступ і прочитайте вміст поточної клітини style=color:#888;font-style:italic>                PageTableAreaCell cell = t.getCell(row, column); if (cell != null) { // Виведіть текстове значення кожної клітини таблиці style=color:#888;font-style:italic>                    System.out.print(cell.getText()); System.out.print(" | "); } } } } }

`Вступ до API GroupDocs.Parser for Java`

GroupDocs.Parser — це багатофункціональний API для витягання вмісту для платформ Java. Він дозволяє розробникам точно аналізувати таблиці, текст, графіку, посилання та структуровані дані з PDF, документів Word, таблиць Excel, презентацій PowerPoint та багато іншого — без потреби у сторонніх плагінах.

Дізнатися більше

`Готові почати?`

Завантажте GroupDocs.Parser безкоштовно або отримайте пробну ліцензію для повного доступу!

Завантажити Maven
Почніть безкоштовну пробну версію

`Корисні ресурси`

Вивчіть документацію, зразки коду та підтримку спільноти для покращення вашого досвіду.


Документація
Посилання API
Зразки коду
Безкоштовна підтримка
Оплачувана підтримка

`Типи документів, що підтримуються для витягання таблиць`

GroupDocs.Parser забезпечує надійне виявлення таблиць у різних типах файлів. Ось список найбільш поширених форматів документів для витягання таблиць.

Парсинг PDF(Формат портативного документа)
Парсинг DOCX(Документ Word Office 2007+)
Парсинг XLSX(Відкрите XML-робочий зошит)
Парсинг TXT(Текстовий файл)
Парсинг RTF(Формат багатого тексту)
Парсинг XML(Мова розмітки eXtensible)
Парсинг EPUB(Відкритий файл eBook)

Отримайте дані таблиць з PPTX за допомогою Java

Як отримати таблиці з Pptx у Java

Розширені інструменти для витягання вмісту

Точне аналізування таблиць по різних форматах

Зчитуйте табличні структури з різноманітних джерел

Налаштовувані параметри витягання таблиць

Приклад: витягти таблиці з документа Excel

Java

Вступ до API GroupDocs.Parser for Java

Готові почати?

Корисні ресурси

Типи документів, що підтримуються для витягання таблиць

Поради щодо тимчасової ліцензії

`Вступ до API GroupDocs.Parser for Java`

`Готові почати?`

`Корисні ресурси`

`Типи документів, що підтримуються для витягання таблиць`

`Поради щодо тимчасової ліцензії`