GroupDocs.Parser for Java

Recupera dati tabulari da XML utilizzando Java

Rileva ed estrai senza sforzo tabelle da formati come PDF, DOCX e XLSX con GroupDocs.Parser nei tuoi flussi di lavoro Java.

Scarica Maven

Inizia la prova gratuita

Come recuperare tabelle da Xml in Java

Per analizzare tabelle da documenti XML utilizzando GroupDocs.Parser, segui questi passaggi nel tuo ambiente Java:

Crea un’istanza di Parser e carica il file XML di destinazione.
Verifica che il file supporti l’estrazione strutturata delle tabelle.
Utilizza l’API per recuperare gli elementi della tabella dal documento.
Sfrutta i dati estratti in analisi, reportistica o sistemi di automazione.

Copia

// Carica il documento di input con Parser che include elementi della tabella
try (Parser parser = new Parser("input.xml"))
{
    // Verifica che il tipo di documento consenta il riconoscimento delle tabelle
    if (!parser.getFeatures().isTables()) {
        System.out.println("Aggiungi logica per file che non supportano le tabelle");
        return;
    }

    // Definisci regole per interpretare la struttura della tabella
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Imposta parametri per estrarre le tabelle
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Esegui l'estrazione delle tabelle sul documento caricato
    Iterable<PageTableArea> tables = parser.getTables(options);

    //  Elabora ciascuna tabella estratta dal risultato
    for (PageTableArea t : tables) 
    {
    }
}

<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>24.9</version>
</dependency>
</dependencies>
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://repository.groupdocs.com/repo/</url>
</repository>
</repositories>

clicca per copiare

copiato

Altri esempi Documentazione

Strumenti avanzati per l’estrazione dei contenuti

Oltre a leggere le tabelle, GroupDocs.Parser supporta la cattura di testo semplice, elementi visivi, metadati incorporati e oggetti strutturati per migliorare le attività di elaborazione dei documenti.

Estrazione di contenuti strutturati e dati tabulari

Parsing preciso delle tabelle attraverso formati

Supporto per l’estrazione di tabelle da tipi di documento standard come PDF, Word, Excel e HTML con alta precisione.

Leggi strutture tabulari da fonti diverse

Recupera dati tabulari da fogli di calcolo, documenti e report mantenendo la struttura e l’allineamento.

Impostazioni di estrazione delle tabelle personalizzabili

Controlla il rilevamento del layout, gestisci intestazioni e piè di pagina e affina l’estrazione con opzioni di configurazione flessibili.

Esempio: estrai tabelle da un documento Excel

Questo esempio mostra come estrarre

e iterare attraverso il contenuto della tabella in un file Excel (XLSX) utilizzando GroupDocs.Parser.

Java

//  Inizializza Parser con il file Excel style=color:#888;font-style:italic>try (Parser parser = new Parser("input.pdf")) { // Esci se l'estrazione della tabella non è supportata per questo documento style=color:#888;font-style:italic>    if (!parser.getFeatures().isTables()) { return; } // Applica regole per localizzare il layout della tabella style=color:#888;font-style:italic>    TemplateTableLayout layout = new TemplateTableLayout( java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}), java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0})); // Configura le impostazioni per l'estrazione delle tabelle style=color:#888;font-style:italic>    PageTableAreaOptions options = new PageTableAreaOptions(layout); // Attiva il processo di estrazione style=color:#888;font-style:italic>    Iterable<PageTableArea> tables = parser.getTables(options); // Itera su tutte le strutture tabellari analizzate style=color:#888;font-style:italic>    for (PageTableArea t : tables) { // Itera su ogni riga all'interno della tabella style=color:#888;font-style:italic>        for (int row = 0; row < t.getRowCount(); row++) { // Elabora ogni cella nella riga corrente style=color:#888;font-style:italic>            for (int column = 0; column < t.getColumnCount(); column++) { // Accedi e leggi il contenuto della cella corrente style=color:#888;font-style:italic>                PageTableAreaCell cell = t.getCell(row, column); if (cell != null) { // Output il valore testuale di ciascuna cella della tabella style=color:#888;font-style:italic>                    System.out.print(cell.getText()); System.out.print(" | "); } } } } }

`Introduzione all’API GroupDocs.Parser for Java`

GroupDocs.Parser è un’API per l’estrazione dei contenuti ricca di funzionalità per piattaforme Java. Permette agli sviluppatori di analizzare con precisione tabelle, testo, grafica, collegamenti e dati strutturati da PDF, documenti Word, fogli Excel, presentazioni PowerPoint e altro—senza richiedere plugin di terze parti.

Scopri di più

`Pronto per iniziare?`

Scarica GroupDocs.Parser gratuitamente o ottieni una licenza di prova per l’accesso completo!

Scarica Maven
Inizia la prova gratuita

`Risorse utili`

Esplora la documentazione, i campioni di codice e il supporto della comunità per migliorare la tua esperienza.


Documentazione
Riferimento API
Campioni di codice
Supporto gratuito
Supporto a pagamento

`Tipi di documento supportati per l’estrazione di tabelle`

GroupDocs.Parser offre rilevamento affidabile delle tabelle su più tipi di file. Ecco un elenco dei formati di documento più ampiamente supportati per l’estrazione delle tabelle.

Analizza PDF(Formato Documento Portatile)
Analizza DOCX(Documento Word Office 2007+)
Analizza PPTX(Formato di presentazione Open XML)
Analizza XLSX(Cartella di lavoro Open XML)
Analizza TXT(File di testo)
Analizza RTF(Formato di Testo Ricco)
Analizza EPUB(File eBook Open)

Recupera dati tabulari da XML utilizzando Java

Come recuperare tabelle da Xml in Java

Strumenti avanzati per l’estrazione dei contenuti

Parsing preciso delle tabelle attraverso formati

Leggi strutture tabulari da fonti diverse

Impostazioni di estrazione delle tabelle personalizzabili

Esempio: estrai tabelle da un documento Excel

Java

Introduzione all’API GroupDocs.Parser for Java

Pronto per iniziare?

Risorse utili

Tipi di documento supportati per l’estrazione di tabelle

Suggerimenti per la licenza temporanea

`Introduzione all’API GroupDocs.Parser for Java`

`Pronto per iniziare?`

`Risorse utili`

`Tipi di documento supportati per l’estrazione di tabelle`

`Suggerimenti per la licenza temporanea`