В этом примере показано, как извлечь и обработать содержимое таблицы в файле Excel (XLSX) с помощью GroupDocs.Parser.
Java
// Инициализируйте Parser с файлом Excel
try (Parser parser = new Parser("input.pdf"))
{
// Выходите, если извлечение таблиц не поддерживается для этого документа
if (!parser.getFeatures().isTables())
{
return;
}
// Примените правила для определения разметки таблицы
TemplateTableLayout layout = new TemplateTableLayout(
java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));
// Настройте параметры для извлечения таблицы
PageTableAreaOptions options = new PageTableAreaOptions(layout);
// Запустите процесс извлечения
Iterable<PageTableArea> tables = parser.getTables(options);
// Перебирайте все разобранные структуры таблицы
for (PageTableArea t : tables)
{
// Итерируйте по каждой строке внутри таблицы
for (int row = 0; row < t.getRowCount(); row++)
{
// Обработайте каждую ячейку в текущей строке
for (int column = 0; column < t.getColumnCount(); column++)
{
// Получите и прочитайте содержимое текущей ячейки
PageTableAreaCell cell = t.getCell(row, column);
if (cell != null)
{
// Выведите текстовое значение каждой ячейки таблицы
System.out.print(cell.getText());
System.out.print(" | ");
}
}
}
}
}