GroupDocs.Parser for .NET

Extraia tabelas de TXT usando C#

Identifique e extraia rapidamente estruturas de tabela de arquivos PDF, Word, Excel e outros formatos utilizando GroupDocs.Parser nos seus projetos .NET.

Passos para extrair tabelas de Txt em C#

Siga estas instruções para extrair tabelas de arquivos TXT usando GroupDocs.Parser em seu ambiente .NET:

  1. Inicialize uma instância de Parser e carregue seu documento TXT.
  2. Verifique se a extração de tabelas é suportada para o formato de entrada.
  3. Extraia o conteúdo da tabela do arquivo.
  4. Utilize os dados estruturados da tabela para relatórios, automação ou análises.
// Abra o documento que contém dados de tabela usando Parser
using (Parser parser = new Parser("input.txt")) {

    // Verifique se o formato suporta o reconhecimento de tabelas
    if (!parser.Features.Tables) {
        Console.WriteLine("Gerencie documentos que não suportam a análise de tabelas");
        return;
    }

    // Defina como a estrutura da tabela deve ser reconhecida
    TemplateTableLayout layout = new TemplateTableLayout(
        new double[] { 50, 95, 275, 415, 485, 545 },
        new double[] { 325, 340, 365, 395 });

    // Especifique parâmetros de extração para os dados da tabela
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Extraia tabelas do conteúdo do arquivo
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    //  Percorra cada tabela detectada
    foreach (PageTableArea t in tables)
    {
    }
}
dotnet add package GroupDocs.Parser
clique para copiar
copiado
Mais exemplos Documentação

Capacidades poderosas de extração de dados

Além da análise de tabelas, GroupDocs.Parser pode extrair conteúdos ricos, como blocos de texto, imagens, metadados e outros dados estruturados para facilitar a automação de documentos.

Reconhecimento de tabelas e extração de conteúdo

Detecção precisa de tabelas em vários formatos

Extraia dados tabulares de DOCX, XLSX, PDF, HTML e formatos similares com alta precisão.

Análise de estruturas de tabela a partir de arquivos

Recupere dados de tabela de documentos e planilhas de maneira eficiente, sem perda de formatação.

Configuração flexível de extração de tabelas

Ajuste a detecção de layout, alinhamento de colunas e opções de cabeçalhos/rodapés para controle preciso sobre a saída.

Como extrair tabelas de planilhas Excel

Este exemplo de código mostra como ler e iterar sobre dados de tabela em um arquivo XLSX usando GroupDocs.Parser.

C#

//  Abra o arquivo Excel usando a API Parser
using (Parser parser = new Parser("input.xlsx"))
{
    // Saia se as tabelas não puderem ser extraídas do arquivo
    if (!parser.Features.Tables)
    {
        return;
    }

    // Use regras de layout para localizar conteúdo tabular
    TemplateTableLayout layout = new TemplateTableLayout(
            new double[] { 50, 95, 275, 415, 485, 545 },
            new double[] { 325, 340, 365, 395 });

    // Configure parâmetros de extração para tabelas
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // Realize a operação de extração da tabela
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    // Percorra cada estrutura de tabela detectada
    foreach (PageTableArea t in tables)
    {
        // Itere sobre cada linha na tabela
        for (int row = 0; row < t.RowCount; row++)
        {
            // Percorra as células em cada linha
            for (int column = 0; column < t.ColumnCount; column++)
            {
                // Acesse a célula da tabela atual
                PageTableAreaCell cell = t[row, column];
                if (cell != null)
                {
                    // Exiba o conteúdo de texto de cada célula
                    Console.Write(cell.Text);
                    Console.Write(" | ");
                }
            }
        }
    }
}

Sobre a API GroupDocs.Parser for .NET

GroupDocs.Parser é uma API abrangente para análise de documentos desenvolvida para programadores .NET. Ela possibilita a extração precisa de texto, tabelas, imagens, hyperlinks e outros elementos estruturados de formatos como PDF, DOCX, XLSX, PPTX e muitos outros — sem a necessidade de software de terceiros.
Saiba mais
About illustration

Pronto para começar?

Baixe GroupDocs.Parser gratuitamente ou obtenha uma licença de teste para acesso total!

Recursos úteis

Explore a documentação, as amostras de código e o apoio da comunidade para aprimorar sua experiência.

Formatos suportados para extração de tabelas

GroupDocs.Parser pode extrair dados de tabela de uma variedade de tipos de documentos. Abaixo estão os formatos mais utilizados para a análise estruturada de tabelas.

Dicas de licença temporária

1
Cadastre-se com seu e-mail comercial. Serviços de e-mail gratuitos não são permitidos.
2
Use o botão Obter uma licença temporária na segunda etapa.
 Português