GroupDocs.Parser for Java

Recupere dados de tabela de PPTX usando Java

Detecte e extraia tabelas de formatos como PDF, DOCX e XLSX sem dificuldades com GroupDocs.Parser em seus fluxos de trabalho Java.

Como recuperar tabelas de Pptx em Java

Para analisar tabelas de documentos PPTX usando GroupDocs.Parser, siga estes passos em seu ambiente Java:

  1. Crie uma instância de Parser e carregue o arquivo PPTX alvo.
  2. Verifique se o arquivo suporta a extração de tabelas estruturadas.
  3. Use a API para recuperar elementos de tabela do documento.
  4. Utilize os dados extraídos em análises, relatórios ou sistemas de automação.
// Carregue o documento de entrada com Parser que inclui elementos de tabela
try (Parser parser = new Parser("input.pptx"))
{
    // Verifique se o tipo de documento permite o reconhecimento de tabelas
    if (!parser.getFeatures().isTables()) {
        System.out.println("Adicione lógica para arquivos que não suportam tabelas");
        return;
    }

    // Defina regras para interpretar a estrutura da tabela
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Defina parâmetros para extrair tabelas
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Execute a extração de tabelas no documento carregado
    Iterable<PageTableArea> tables = parser.getTables(options);

    //  Processe cada tabela extraída do resultado
    for (PageTableArea t : tables) 
    {
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
clique para copiar
copiado
Mais exemplos Documentação

Ferramentas avançadas de extração de conteúdo

Além da leitura de tabelas, GroupDocs.Parser suporta a captura de texto simples, elementos visuais, metadados incorporados e objetos estruturados para aprimorar tarefas de processamento de documentos.

Extraindo conteúdo estruturado e dados tabulares

Análise precisa de tabelas em diversos formatos

Suporte para extração de tabelas de tipos de documentos padrão como PDF, Word, Excel e HTML com alta precisão.

Leitura de estruturas tabulares de diversas fontes

Recupere dados de tabela de planilhas, documentos e relatórios, mantendo a estrutura e alinhamento.

Configurações personalizáveis de extração de tabelas

Controle a detecção de layout, gerencie cabeçalhos e rodapés, e ajuste a extração com opções de configuração flexíveis.

Exemplo: extrair tabelas de um documento Excel

Este exemplo demonstra como extrair e percorrer conteúdo de tabela em um arquivo Excel (XLSX) usando GroupDocs.Parser.

Java

//  Inicialize Parser com o arquivo Excel
try (Parser parser = new Parser("input.pdf"))
{
    // Saia se a extração de tabelas não for suportada para este documento
    if (!parser.getFeatures().isTables())
    {
        return;
    }

    // Aplique regras para localizar o layout da tabela
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Configure as definições para extração de tabelas
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // Invoque o processo de extração
    Iterable<PageTableArea> tables = parser.getTables(options);

    // Percorra todas as estruturas de tabela analisadas
    for (PageTableArea t : tables)
    {
        // Itere sobre cada linha dentro da tabela
        for (int row = 0; row < t.getRowCount(); row++)
        {
            // Processo cada célula na linha atual
            for (int column = 0; column < t.getColumnCount(); column++) 
            {
                // Acesse e leia o conteúdo da célula atual
                PageTableAreaCell cell = t.getCell(row, column);
                if (cell != null)
                {
                    // Saia o valor textual de cada célula da tabela
                    System.out.print(cell.getText());
                    System.out.print(" | ");
                }
            }
        }
    }
}

Introdução à API GroupDocs.Parser for Java

GroupDocs.Parser é uma API rica em recursos para extração de conteúdo orientada a plataformas Java. Permite que desenvolvedores façam a análise precisa de tabelas, textos, gráficos, links e dados estruturados a partir de PDFs, documentos do Word, planilhas do Excel, apresentações do PowerPoint e mais—sem exigir plugins de terceiros.
Saiba mais
About illustration

Pronto para começar?

Baixe GroupDocs.Parser gratuitamente ou obtenha uma licença de teste para acesso total!

Recursos úteis

Explore a documentação, as amostras de código e o apoio da comunidade para aprimorar sua experiência.

Tipos de documentos suportados para extração de tabelas

GroupDocs.Parser oferece detecção confiável de tabelas em diversos tipos de arquivos. Aqui está uma lista dos formatos de documentos mais amplamente suportados para extração de tabelas.

Dicas de licença temporária

1
Cadastre-se com seu e-mail comercial. Serviços de e-mail gratuitos não são permitidos.
2
Use o botão Obter uma licença temporária na segunda etapa.
 Português