GroupDocs.Parser for Java

Recupere dados de tabela de PPTX usando Java

Detecte e extraia tabelas de formatos como PDF, DOCX e XLSX sem dificuldades com GroupDocs.Parser em seus fluxos de trabalho Java.

Baixar Maven

Comece o teste gratuito

Como recuperar tabelas de Pptx em Java

Para analisar tabelas de documentos PPTX usando GroupDocs.Parser, siga estes passos em seu ambiente Java:

Crie uma instância de Parser e carregue o arquivo PPTX alvo.
Verifique se o arquivo suporta a extração de tabelas estruturadas.
Use a API para recuperar elementos de tabela do documento.
Utilize os dados extraídos em análises, relatórios ou sistemas de automação.

Copiar

// Carregue o documento de entrada com Parser que inclui elementos de tabela
try (Parser parser = new Parser("input.pptx"))
{
    // Verifique se o tipo de documento permite o reconhecimento de tabelas
    if (!parser.getFeatures().isTables()) {
        System.out.println("Adicione lógica para arquivos que não suportam tabelas");
        return;
    }

    // Defina regras para interpretar a estrutura da tabela
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // Defina parâmetros para extrair tabelas
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Execute a extração de tabelas no documento carregado
    Iterable<PageTableArea> tables = parser.getTables(options);

    //  Processe cada tabela extraída do resultado
    for (PageTableArea t : tables) 
    {
    }
}

<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>24.9</version>
</dependency>
</dependencies>
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://repository.groupdocs.com/repo/</url>
</repository>
</repositories>

clique para copiar

copiado

Mais exemplos Documentação

Ferramentas avançadas de extração de conteúdo

Além da leitura de tabelas, GroupDocs.Parser suporta a captura de texto simples, elementos visuais, metadados incorporados e objetos estruturados para aprimorar tarefas de processamento de documentos.

Extraindo conteúdo estruturado e dados tabulares

Análise precisa de tabelas em diversos formatos

Suporte para extração de tabelas de tipos de documentos padrão como PDF, Word, Excel e HTML com alta precisão.

Leitura de estruturas tabulares de diversas fontes

Recupere dados de tabela de planilhas, documentos e relatórios, mantendo a estrutura e alinhamento.

Configurações personalizáveis de extração de tabelas

Controle a detecção de layout, gerencie cabeçalhos e rodapés, e ajuste a extração com opções de configuração flexíveis.

Exemplo: extrair tabelas de um documento Excel

Este exemplo demonstra como extrair

e percorrer conteúdo de tabela em um arquivo Excel (XLSX) usando GroupDocs.Parser.

Java

//  Inicialize Parser com o arquivo Excel style=color:#888;font-style:italic>try (Parser parser = new Parser("input.pdf")) { // Saia se a extração de tabelas não for suportada para este documento style=color:#888;font-style:italic>    if (!parser.getFeatures().isTables()) { return; } // Aplique regras para localizar o layout da tabela style=color:#888;font-style:italic>    TemplateTableLayout layout = new TemplateTableLayout( java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}), java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0})); // Configure as definições para extração de tabelas style=color:#888;font-style:italic>    PageTableAreaOptions options = new PageTableAreaOptions(layout); // Invoque o processo de extração style=color:#888;font-style:italic>    Iterable<PageTableArea> tables = parser.getTables(options); // Percorra todas as estruturas de tabela analisadas style=color:#888;font-style:italic>    for (PageTableArea t : tables) { // Itere sobre cada linha dentro da tabela style=color:#888;font-style:italic>        for (int row = 0; row < t.getRowCount(); row++) { // Processo cada célula na linha atual style=color:#888;font-style:italic>            for (int column = 0; column < t.getColumnCount(); column++) { // Acesse e leia o conteúdo da célula atual style=color:#888;font-style:italic>                PageTableAreaCell cell = t.getCell(row, column); if (cell != null) { // Saia o valor textual de cada célula da tabela style=color:#888;font-style:italic>                    System.out.print(cell.getText()); System.out.print(" | "); } } } } }

`Introdução à API GroupDocs.Parser for Java`

GroupDocs.Parser é uma API rica em recursos para extração de conteúdo orientada a plataformas Java. Permite que desenvolvedores façam a análise precisa de tabelas, textos, gráficos, links e dados estruturados a partir de PDFs, documentos do Word, planilhas do Excel, apresentações do PowerPoint e mais—sem exigir plugins de terceiros.

Saiba mais

`Pronto para começar?`

Baixe GroupDocs.Parser gratuitamente ou obtenha uma licença de teste para acesso total!

Baixar Maven
Comece o teste gratuito

`Recursos úteis`

Explore a documentação, as amostras de código e o apoio da comunidade para aprimorar sua experiência.


Documentação
Referência da API
Amostras de código
Suporte gratuito
Apoio pago

`Tipos de documentos suportados para extração de tabelas`

GroupDocs.Parser oferece detecção confiável de tabelas em diversos tipos de arquivos. Aqui está uma lista dos formatos de documentos mais amplamente suportados para extração de tabelas.

Analisar PDF(Formato de Documento Portátil)
Analisar DOCX(Documento do Word Office 2007+)
Analisar XLSX(Caderno de Trabalho Open XML)
Analisar TXT(Arquivo de texto)
Analisar RTF(Formato de Texto Rico)
Analisar XML(Linguagem de Marcação eXtensível)
Analisar EPUB(Arquivo de eBook Open)

Recupere dados de tabela de PPTX usando Java

Como recuperar tabelas de Pptx em Java

Ferramentas avançadas de extração de conteúdo

Análise precisa de tabelas em diversos formatos

Leitura de estruturas tabulares de diversas fontes

Configurações personalizáveis de extração de tabelas

Exemplo: extrair tabelas de um documento Excel

Java

Introdução à API GroupDocs.Parser for Java

Pronto para começar?

Recursos úteis

Tipos de documentos suportados para extração de tabelas

Dicas de licença temporária

`Introdução à API GroupDocs.Parser for Java`

`Pronto para começar?`

`Recursos úteis`

`Tipos de documentos suportados para extração de tabelas`

`Dicas de licença temporária`