GroupDocs.Parser for Java

Tabellendaten aus XML mit Java abrufen

Erkennen und extrahieren Sie nahtlos Tabellen aus Formaten wie PDF, DOCX und XLSX mit GroupDocs.Parser in Ihren Java-Workflows.

Maven-Download

Kostenlose Testversion starten

So extrahieren Sie Tabellen aus Xml in Java

Um Tabellen aus XML-Dokumenten mit GroupDocs.Parser zu parsen, folgen Sie diesen Schritten in Ihrer Java-Umgebung:

Erstellen Sie eine Parser-Instanz und laden Sie die Ziel-XML-Datei.
Überprüfen Sie, ob die Datei die strukturierte Tabellenerfassung unterstützt.
Verwenden Sie die API, um Tabellenelemente aus dem Dokument abzurufen.
Nutzen Sie die extrahierten Daten in Analysen, Berichterstattung oder Automatisierungssystemen.

Kopieren

// Laden Sie das Eingabedokument mit Parser, das Tabellenelemente enthält.
try (Parser parser = new Parser("input.xml"))
{
    // Überprüfen Sie, ob der Dokumenttyp die Tabellenkennung zulässt.
    if (!parser.getFeatures().isTables()) {
        System.out.println("Fügen Sie Logik für Dateien hinzu, die keine Tabellen unterstützen.");
        return;
    }

    // Definieren Sie Regeln zur Interpretation der Tabellenstruktur.
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Legen Sie Parameter zum Extrahieren von Tabellen fest.
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Führen Sie die Tabellenerfassung auf dem geladenen Dokument aus.
    Iterable<PageTableArea> tables = parser.getTables(options);

    //  Verarbeiten Sie jede aus dem Ergebnis extrahierte Tabelle.
    for (PageTableArea t : tables) 
    {
    }
}

<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>24.9</version>
</dependency>
</dependencies>
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://repository.groupdocs.com/repo/</url>
</repository>
</repositories>

Klicken zum Kopieren

Kopiert

Weitere Beispiele Dokumentation

Erweiterte Inhaltsextraktionswerkzeuge

Neben der Lesung von Tabellen unterstützt GroupDocs.Parser die Erfassung von Plain Text, visuellen Elementen, eingebetteten Metadaten und strukturierten Objekten zur Optimierung von Dokumentenverarbeitungsaufgaben.

Strukturierte Inhalte und tabellarische Daten extrahieren

Präzise Tabellenerfassung über Formate hinweg

Unterstützung der Tabellenerfassung aus Standarddokumenttypen wie PDF, Word, Excel und HTML mit hoher Genauigkeit.

Lesen tabellarischer Strukturen aus unterschiedlichen Quellen

Rufen Sie Tabellendaten aus Tabellenkalkulationen, Dokumenten und Berichten ab und bewahren Sie die Struktur und Ausrichtung.

Anpassbare Einstellungen zur Tabellenerfassung

Kontrollieren Sie die Layouterkennung, verwalten Sie Kopf- und Fußzeilen und optimieren Sie die Extraktion mit flexiblen Konfigurationsoptionen.

Beispiel: Tabellen aus einem Excel-Dokument extrahieren

Dieses Beispiel zeigt, wie Sie Tabelleninhalte

in einer Excel (XLSX)-Datei mit GroupDocs.Parser extrahieren und durchlaufen.

Java

//  Initialisieren Sie Parser mit der Excel-Datei. style=color:#888;font-style:italic>try (Parser parser = new Parser("input.pdf")) { // Beenden Sie, wenn die Tabellenerfassung für dieses Dokument nicht unterstützt wird. style=color:#888;font-style:italic>    if (!parser.getFeatures().isTables()) { return; } // Anwenden von Regeln zur Bestimmung des Tabellenlayouts. style=color:#888;font-style:italic>    TemplateTableLayout layout = new TemplateTableLayout( java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}), java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0})); // Einstellungen für die Tabellenerfassung konfigurieren. style=color:#888;font-style:italic>    PageTableAreaOptions options = new PageTableAreaOptions(layout); // Den Extraktionsprozess aufrufen. style=color:#888;font-style:italic>    Iterable<PageTableArea> tables = parser.getTables(options); // Über alle geparsten Tabellenstrukturen iterieren. style=color:#888;font-style:italic>    for (PageTableArea t : tables) { // Über jede Zeile innerhalb der Tabelle iterieren. style=color:#888;font-style:italic>        for (int row = 0; row < t.getRowCount(); row++) { // Jede Zelle in der aktuellen Zeile verarbeiten. style=color:#888;font-style:italic>            for (int column = 0; column < t.getColumnCount(); column++) { // Auf den Inhalt der aktuellen Zelle zugreifen und ihn lesen. style=color:#888;font-style:italic>                PageTableAreaCell cell = t.getCell(row, column); if (cell != null) { // Den Textwert jeder Tabellenzelle ausgeben. style=color:#888;font-style:italic>                    System.out.print(cell.getText()); System.out.print(" | "); } } } } }

`Einführung in die GroupDocs.Parser for Java-API`

GroupDocs.Parser ist eine funktionsreiche API zur Inhaltsextraktion für Java-Plattformen. Sie ermöglicht Entwicklern, Tabellen, Texte, Grafiken, Links und strukturierte Daten aus PDFs, Word-Dokumenten, Excel-Tabellen, PowerPoint-Präsentationen und mehr präzise zu parsen – ohne dass Drittanbieter-Plugins erforderlich sind.

Mehr erfahren

`Bereit, loszulegen?`

Laden Sie GroupDocs.Parser kostenlos herunter oder holen Sie sich eine Testlizenz für vollen Zugriff!

Maven-Download
Kostenlose Testversion starten

`Nützliche Ressourcen`

Erforschen Sie die Dokumentation, Code -Beispiele und die Unterstützung der Community, um Ihre Erfahrungen zu verbessern.


Dokumentation
API-Referenz
Code-Beispiele
Freie Unterstützung
Bezahlte Unterstützung

`Unterstützte Dokumenttypen für die Tabellenerfassung`

GroupDocs.Parser bietet zuverlässige Tabellenerkennung über mehrere Dateitypen hinweg. Hier ist eine Liste der am häufigsten unterstützten Dokumentenformate zur Extraktion von Tabellen.

PDF parsen(Portable Document Format)
DOCX parsen(Office 2007+ Word-Dokument)
PPTX parsen(Open XML-Präsentationsformat)
XLSX parsen(Open XML-Arbeitsmappe)
TXT parsen(Textdatei)
RTF parsen(Rich Text Format)
EPUB parsen(Open eBook-Datei)

Tabellendaten aus XML mit Java abrufen

So extrahieren Sie Tabellen aus Xml in Java

Erweiterte Inhaltsextraktionswerkzeuge

Präzise Tabellenerfassung über Formate hinweg

Lesen tabellarischer Strukturen aus unterschiedlichen Quellen

Anpassbare Einstellungen zur Tabellenerfassung

Beispiel: Tabellen aus einem Excel-Dokument extrahieren

Java

Einführung in die GroupDocs.Parser for Java-API

Bereit, loszulegen?

Nützliche Ressourcen

Unterstützte Dokumenttypen für die Tabellenerfassung

Tipps zur temporären Lizenz

`Einführung in die GroupDocs.Parser for Java-API`

`Bereit, loszulegen?`

`Nützliche Ressourcen`

`Unterstützte Dokumenttypen für die Tabellenerfassung`

`Tipps zur temporären Lizenz`