Dieses Beispiel zeigt, wie Sie Tabelleninhalte in einer Excel (XLSX)-Datei mit GroupDocs.Parser extrahieren und durchlaufen.
Java
// Initialisieren Sie Parser mit der Excel-Datei.
try (Parser parser = new Parser("input.pdf"))
{
// Beenden Sie, wenn die Tabellenerfassung für dieses Dokument nicht unterstützt wird.
if (!parser.getFeatures().isTables())
{
return;
}
// Anwenden von Regeln zur Bestimmung des Tabellenlayouts.
TemplateTableLayout layout = new TemplateTableLayout(
java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));
// Einstellungen für die Tabellenerfassung konfigurieren.
PageTableAreaOptions options = new PageTableAreaOptions(layout);
// Den Extraktionsprozess aufrufen.
Iterable<PageTableArea> tables = parser.getTables(options);
// Über alle geparsten Tabellenstrukturen iterieren.
for (PageTableArea t : tables)
{
// Über jede Zeile innerhalb der Tabelle iterieren.
for (int row = 0; row < t.getRowCount(); row++)
{
// Jede Zelle in der aktuellen Zeile verarbeiten.
for (int column = 0; column < t.getColumnCount(); column++)
{
// Auf den Inhalt der aktuellen Zelle zugreifen und ihn lesen.
PageTableAreaCell cell = t.getCell(row, column);
if (cell != null)
{
// Den Textwert jeder Tabellenzelle ausgeben.
System.out.print(cell.getText());
System.out.print(" | ");
}
}
}
}
}