GroupDocs.Parser for Java

Recupera dati tabulari da XML utilizzando Java

Rileva ed estrai senza sforzo tabelle da formati come PDF, DOCX e XLSX con GroupDocs.Parser nei tuoi flussi di lavoro Java.

Come recuperare tabelle da Xml in Java

Per analizzare tabelle da documenti XML utilizzando GroupDocs.Parser, segui questi passaggi nel tuo ambiente Java:

  1. Crea un’istanza di Parser e carica il file XML di destinazione.
  2. Verifica che il file supporti l’estrazione strutturata delle tabelle.
  3. Utilizza l’API per recuperare gli elementi della tabella dal documento.
  4. Sfrutta i dati estratti in analisi, reportistica o sistemi di automazione.
// Carica il documento di input con Parser che include elementi della tabella
try (Parser parser = new Parser("input.xml"))
{
    // Verifica che il tipo di documento consenta il riconoscimento delle tabelle
    if (!parser.getFeatures().isTables()) {
        System.out.println("Aggiungi logica per file che non supportano le tabelle");
        return;
    }

    // Definisci regole per interpretare la struttura della tabella
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Imposta parametri per estrarre le tabelle
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Esegui l'estrazione delle tabelle sul documento caricato
    Iterable<PageTableArea> tables = parser.getTables(options);

    //  Elabora ciascuna tabella estratta dal risultato
    for (PageTableArea t : tables) 
    {
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
clicca per copiare
copiato
Altri esempi Documentazione

Strumenti avanzati per l’estrazione dei contenuti

Oltre a leggere le tabelle, GroupDocs.Parser supporta la cattura di testo semplice, elementi visivi, metadati incorporati e oggetti strutturati per migliorare le attività di elaborazione dei documenti.

Estrazione di contenuti strutturati e dati tabulari

Parsing preciso delle tabelle attraverso formati

Supporto per l’estrazione di tabelle da tipi di documento standard come PDF, Word, Excel e HTML con alta precisione.

Leggi strutture tabulari da fonti diverse

Recupera dati tabulari da fogli di calcolo, documenti e report mantenendo la struttura e l’allineamento.

Impostazioni di estrazione delle tabelle personalizzabili

Controlla il rilevamento del layout, gestisci intestazioni e piè di pagina e affina l’estrazione con opzioni di configurazione flessibili.

Esempio: estrai tabelle da un documento Excel

Questo esempio mostra come estrarre e iterare attraverso il contenuto della tabella in un file Excel (XLSX) utilizzando GroupDocs.Parser.

Java

//  Inizializza Parser con il file Excel
try (Parser parser = new Parser("input.pdf"))
{
    // Esci se l'estrazione della tabella non è supportata per questo documento
    if (!parser.getFeatures().isTables())
    {
        return;
    }

    // Applica regole per localizzare il layout della tabella
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Configura le impostazioni per l'estrazione delle tabelle
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // Attiva il processo di estrazione
    Iterable<PageTableArea> tables = parser.getTables(options);

    // Itera su tutte le strutture tabellari analizzate
    for (PageTableArea t : tables)
    {
        // Itera su ogni riga all'interno della tabella
        for (int row = 0; row < t.getRowCount(); row++)
        {
            // Elabora ogni cella nella riga corrente
            for (int column = 0; column < t.getColumnCount(); column++) 
            {
                // Accedi e leggi il contenuto della cella corrente
                PageTableAreaCell cell = t.getCell(row, column);
                if (cell != null)
                {
                    // Output il valore testuale di ciascuna cella della tabella
                    System.out.print(cell.getText());
                    System.out.print(" | ");
                }
            }
        }
    }
}

Introduzione all’API GroupDocs.Parser for Java

GroupDocs.Parser è un’API per l’estrazione dei contenuti ricca di funzionalità per piattaforme Java. Permette agli sviluppatori di analizzare con precisione tabelle, testo, grafica, collegamenti e dati strutturati da PDF, documenti Word, fogli Excel, presentazioni PowerPoint e altro—senza richiedere plugin di terze parti.
Scopri di più
About illustration

Pronto per iniziare?

Scarica GroupDocs.Parser gratuitamente o ottieni una licenza di prova per l’accesso completo!

Risorse utili

Esplora la documentazione, i campioni di codice e il supporto della comunità per migliorare la tua esperienza.

Tipi di documento supportati per l’estrazione di tabelle

GroupDocs.Parser offre rilevamento affidabile delle tabelle su più tipi di file. Ecco un elenco dei formati di documento più ampiamente supportati per l’estrazione delle tabelle.

Suggerimenti per la licenza temporanea

1
Iscriviti con la tua email di lavoro. I servizi di posta gratuiti non sono consentiti.
2
Utilizza il pulsante Ottieni una licenza temporanea nel secondo passaggio.
 Italiano