GroupDocs.Parser for Java

Tabellendaten aus XLSX mit Java abrufen

Erkennen und extrahieren Sie nahtlos Tabellen aus Formaten wie PDF, DOCX und XLSX mit GroupDocs.Parser in Ihren Java-Workflows.

So extrahieren Sie Tabellen aus Xlsx in Java

Um Tabellen aus XLSX-Dokumenten mit GroupDocs.Parser zu parsen, folgen Sie diesen Schritten in Ihrer Java-Umgebung:

  1. Erstellen Sie eine Parser-Instanz und laden Sie die Ziel-XLSX-Datei.
  2. Überprüfen Sie, ob die Datei die strukturierte Tabellenerfassung unterstützt.
  3. Verwenden Sie die API, um Tabellenelemente aus dem Dokument abzurufen.
  4. Nutzen Sie die extrahierten Daten in Analysen, Berichterstattung oder Automatisierungssystemen.
// Laden Sie das Eingabedokument mit Parser, das Tabellenelemente enthält.
try (Parser parser = new Parser("input.xlsx"))
{
    // Überprüfen Sie, ob der Dokumenttyp die Tabellenkennung zulässt.
    if (!parser.getFeatures().isTables()) {
        System.out.println("Fügen Sie Logik für Dateien hinzu, die keine Tabellen unterstützen.");
        return;
    }

    // Definieren Sie Regeln zur Interpretation der Tabellenstruktur.
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Legen Sie Parameter zum Extrahieren von Tabellen fest.
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Führen Sie die Tabellenerfassung auf dem geladenen Dokument aus.
    Iterable<PageTableArea> tables = parser.getTables(options);

    //  Verarbeiten Sie jede aus dem Ergebnis extrahierte Tabelle.
    for (PageTableArea t : tables) 
    {
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
Klicken zum Kopieren
Kopiert
Weitere Beispiele Dokumentation

Erweiterte Inhaltsextraktionswerkzeuge

Neben der Lesung von Tabellen unterstützt GroupDocs.Parser die Erfassung von Plain Text, visuellen Elementen, eingebetteten Metadaten und strukturierten Objekten zur Optimierung von Dokumentenverarbeitungsaufgaben.

Strukturierte Inhalte und tabellarische Daten extrahieren

Präzise Tabellenerfassung über Formate hinweg

Unterstützung der Tabellenerfassung aus Standarddokumenttypen wie PDF, Word, Excel und HTML mit hoher Genauigkeit.

Lesen tabellarischer Strukturen aus unterschiedlichen Quellen

Rufen Sie Tabellendaten aus Tabellenkalkulationen, Dokumenten und Berichten ab und bewahren Sie die Struktur und Ausrichtung.

Anpassbare Einstellungen zur Tabellenerfassung

Kontrollieren Sie die Layouterkennung, verwalten Sie Kopf- und Fußzeilen und optimieren Sie die Extraktion mit flexiblen Konfigurationsoptionen.

Beispiel: Tabellen aus einem Excel-Dokument extrahieren

Dieses Beispiel zeigt, wie Sie Tabelleninhalte in einer Excel (XLSX)-Datei mit GroupDocs.Parser extrahieren und durchlaufen.

Java

//  Initialisieren Sie Parser mit der Excel-Datei.
try (Parser parser = new Parser("input.pdf"))
{
    // Beenden Sie, wenn die Tabellenerfassung für dieses Dokument nicht unterstützt wird.
    if (!parser.getFeatures().isTables())
    {
        return;
    }

    // Anwenden von Regeln zur Bestimmung des Tabellenlayouts.
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Einstellungen für die Tabellenerfassung konfigurieren.
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // Den Extraktionsprozess aufrufen.
    Iterable<PageTableArea> tables = parser.getTables(options);

    // Über alle geparsten Tabellenstrukturen iterieren.
    for (PageTableArea t : tables)
    {
        // Über jede Zeile innerhalb der Tabelle iterieren.
        for (int row = 0; row < t.getRowCount(); row++)
        {
            // Jede Zelle in der aktuellen Zeile verarbeiten.
            for (int column = 0; column < t.getColumnCount(); column++) 
            {
                // Auf den Inhalt der aktuellen Zelle zugreifen und ihn lesen.
                PageTableAreaCell cell = t.getCell(row, column);
                if (cell != null)
                {
                    // Den Textwert jeder Tabellenzelle ausgeben.
                    System.out.print(cell.getText());
                    System.out.print(" | ");
                }
            }
        }
    }
}

Einführung in die GroupDocs.Parser for Java-API

GroupDocs.Parser ist eine funktionsreiche API zur Inhaltsextraktion für Java-Plattformen. Sie ermöglicht Entwicklern, Tabellen, Texte, Grafiken, Links und strukturierte Daten aus PDFs, Word-Dokumenten, Excel-Tabellen, PowerPoint-Präsentationen und mehr präzise zu parsen – ohne dass Drittanbieter-Plugins erforderlich sind.
Mehr erfahren
About illustration

Bereit, loszulegen?

Laden Sie GroupDocs.Parser kostenlos herunter oder holen Sie sich eine Testlizenz für vollen Zugriff!

Nützliche Ressourcen

Erforschen Sie die Dokumentation, Code -Beispiele und die Unterstützung der Community, um Ihre Erfahrungen zu verbessern.

Unterstützte Dokumenttypen für die Tabellenerfassung

GroupDocs.Parser bietet zuverlässige Tabellenerkennung über mehrere Dateitypen hinweg. Hier ist eine Liste der am häufigsten unterstützten Dokumentenformate zur Extraktion von Tabellen.

Tipps zur temporären Lizenz

1
Melden Sie sich mit Ihrer geschäftlichen E-Mail-Adresse an. Kostenlose E-Mail-Dienste sind nicht zulässig.
2
Klicken Sie im zweiten Schritt auf die Schaltfläche Provisorische Lizenz anfordern.
 Deutsch