GroupDocs.Parser for .NET

Estrai tabelle da XML usando C#

Identifica rapidamente ed estrae le strutture delle tabelle da PDF, Word, Excel e altri formati di file utilizzando GroupDocs.Parser nei tuoi progetti .NET.

Passaggi per estrarre tabelle da Xml in C#

Segui queste istruzioni per estrarre tabelle da file XML utilizzando GroupDocs.Parser all’interno del tuo ambiente .NET:

  1. Inizializza un’istanza di Parser e carica il tuo documento XML.
  2. Controlla se il supporto per l’estrazione delle tabelle è disponibile per il formato di input.
  3. Estrai il contenuto della tabella dal file.
  4. Utilizza i dati tabulari strutturati per reportistica, automazione o analisi.
// Apri il documento che contiene dati sotto forma di tabella utilizzando Parser
using (Parser parser = new Parser("input.xml")) {

    // Controlla se il formato supporta il riconoscimento delle tabelle
    if (!parser.Features.Tables) {
        Console.WriteLine("Gestisci i documenti che non supportano il parsing delle tabelle");
        return;
    }

    // Definisci come deve essere riconosciuta la struttura della tabella
    TemplateTableLayout layout = new TemplateTableLayout(
        new double[] { 50, 95, 275, 415, 485, 545 },
        new double[] { 325, 340, 365, 395 });

    // Specifica i parametri di estrazione per i dati delle tabelle
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Estrai tabelle dal contenuto del file
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    //  Ciclo attraverso ogni tabella rilevata
    foreach (PageTableArea t in tables)
    {
    }
}
dotnet add package GroupDocs.Parser
clicca per copiare
copiato
Altri esempi Documentazione

Potenti capacità di estrazione dei dati

Oltre al parsing delle tabelle, GroupDocs.Parser può estrarre contenuti ricchi come blocchi di testo, immagini, metadati e altri dati strutturati per facilitare l’automazione dei documenti.

Riconoscimento delle tabelle e estrazione del contenuto

Riconoscimento preciso delle tabelle multi-formato

Estrai dati tabulari da DOCX, XLSX, PDF, HTML e formati simili con alta precisione.

Analizza le strutture delle tabelle dai file

Recupera efficientemente i dati delle tabelle dai documenti e dai fogli di calcolo senza perdita di formattazione.

Configurazione flessibile dell’estrazione delle tabelle

Regola il riconoscimento del layout, l’allineamento delle colonne e le opzioni di intestazione/footer per un controllo preciso sull’output.

Come estrarre tabelle da fogli di calcolo Excel

Questo campione di codice mostra come leggere e iterare attraverso i dati di una tabella in un file XLSX utilizzando GroupDocs.Parser.

C#

//  Apri il file Excel utilizzando l'API Parser
using (Parser parser = new Parser("input.xlsx"))
{
    // Esci se le tabelle non possono essere estratte dal file
    if (!parser.Features.Tables)
    {
        return;
    }

    // Utilizza le regole di layout per individuare contenuti tabulari
    TemplateTableLayout layout = new TemplateTableLayout(
            new double[] { 50, 95, 275, 415, 485, 545 },
            new double[] { 325, 340, 365, 395 });

    // Imposta i parametri di estrazione per le tabelle
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // Esegui l'operazione di estrazione delle tabelle
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    // Esamina ogni struttura di tabella rilevata
    foreach (PageTableArea t in tables)
    {
        // Itera attraverso ogni riga nella tabella
        for (int row = 0; row < t.RowCount; row++)
        {
            // Ciclo attraverso le celle in ogni riga
            for (int column = 0; column < t.ColumnCount; column++)
            {
                // Accedi alla cella della tabella corrente
                PageTableAreaCell cell = t[row, column];
                if (cell != null)
                {
                    // Visualizza il contenuto di testo di ogni cella
                    Console.Write(cell.Text);
                    Console.Write(" | ");
                }
            }
        }
    }
}

Informazioni sull’API GroupDocs.Parser for .NET

GroupDocs.Parser è un’API completa per il parsing dei documenti progettata per sviluppatori .NET. Consente di estrarre con precisione testo, tabelle, immagini, collegamenti ipertestuali e altri elementi strutturati da formati come PDF, DOCX, XLSX, PPTX e molti altri - senza la necessità di software di terze parti.
Scopri di più
About illustration

Pronto per iniziare?

Scarica GroupDocs.Parser gratuitamente o ottieni una licenza di prova per l’accesso completo!

Risorse utili

Esplora la documentazione, i campioni di codice e il supporto della comunità per migliorare la tua esperienza.

Formati supportati per l’estrazione delle tabelle

GroupDocs.Parser può estrarre dati tabulari da una varietà di tipi di documenti. Di seguito sono elencati i formati più comunemente utilizzati per il parsing delle tabelle strutturate.

Suggerimenti per la licenza temporanea

1
Iscriviti con la tua email di lavoro. I servizi di posta gratuiti non sono consentiti.
2
Utilizza il pulsante Ottieni una licenza temporanea nel secondo passaggio.
 Italiano