GroupDocs.Parser for .NET

Extrae tablas de EPUB usando C#

Identifica y extrae rápidamente estructuras de tablas de PDF, Word, Excel y otros formatos de archivo utilizando GroupDocs.Parser en tus proyectos de .NET.

Pasos para extraer tablas de Epub en C#

Sigue estas instrucciones para extraer tablas de archivos EPUB usando GroupDocs.Parser dentro de tu entorno .NET:

  1. Inicializa una instancia de Parser y carga tu documento EPUB.
  2. Verifica si la extracción de tablas es soportada para el formato de entrada.
  3. Extrae el contenido de la tabla del archivo.
  4. Utiliza los datos de la tabla estructurada para informes, automatización o análisis.
// Abre el documento que contiene datos de tabla utilizando Parser
using (Parser parser = new Parser("input.epub")) {

    // Verifica si el formato soporta el reconocimiento de tablas
    if (!parser.Features.Tables) {
        Console.WriteLine("Maneja documentos que no soportan el análisis de tablas");
        return;
    }

    // Define cómo debe reconocerse la estructura de la tabla
    TemplateTableLayout layout = new TemplateTableLayout(
        new double[] { 50, 95, 275, 415, 485, 545 },
        new double[] { 325, 340, 365, 395 });

    // Especifica parámetros de extracción para los datos de la tabla
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Extrae tablas del contenido del archivo
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    //  Itera a través de cada tabla detectada
    foreach (PageTableArea t in tables)
    {
    }
}
dotnet add package GroupDocs.Parser
haga clic para copiar
copiado
Más ejemplos Documentación

Potentes capacidades de extracción de datos

Además del análisis de tablas, GroupDocs.Parser puede extraer contenido enriquecido como bloques de texto, imágenes, metadatos y otros datos estructurados para facilitar la automatización de documentos.

Reconocimiento de tablas y extracción de contenido

Detección precisa de tablas en múltiples formatos

Extrae datos tabulares de DOCX, XLSX, PDF, HTML y formatos similares con alta precisión.

Analiza estructuras de tablas desde archivos

Recupera eficientemente datos de tablas de documentos y hojas de cálculo sin pérdida de formato.

Configuración flexible de extracción de tablas

Ajusta la detección de diseño, la alineación de columnas y las opciones de encabezado/pie de página para un control preciso sobre la salida.

Cómo extraer tablas de hojas de cálculo de Excel

Este ejemplo de código muestra cómo leer e iterar a través de datos de tabla en un archivo XLSX usando GroupDocs.Parser.

C#

//  Abre el archivo de Excel utilizando la API Parser
using (Parser parser = new Parser("input.xlsx"))
{
    // Sal si no se pueden extraer tablas del archivo
    if (!parser.Features.Tables)
    {
        return;
    }

    // Utiliza reglas de diseño para localizar contenido tabular
    TemplateTableLayout layout = new TemplateTableLayout(
            new double[] { 50, 95, 275, 415, 485, 545 },
            new double[] { 325, 340, 365, 395 });

    // Configura los parámetros de extracción para las tablas
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // Realiza la operación de extracción de tablas
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    // Revisa la estructura de cada tabla detectada
    foreach (PageTableArea t in tables)
    {
        // Itera a través de cada fila en la tabla
        for (int row = 0; row < t.RowCount; row++)
        {
            // Itera sobre las celdas en cada fila
            for (int column = 0; column < t.ColumnCount; column++)
            {
                // Accede a la celda actual de la tabla
                PageTableAreaCell cell = t[row, column];
                if (cell != null)
                {
                    // Muestra el contenido de texto de cada celda
                    Console.Write(cell.Text);
                    Console.Write(" | ");
                }
            }
        }
    }
}

Acerca de la API GroupDocs.Parser for .NET

GroupDocs.Parser es una API integral de análisis de documentos creada para desarrolladores de .NET. Permite la extracción precisa de texto, tablas, imágenes, hiperenlaces y otros elementos estructurados de formatos como PDF, DOCX, XLSX, PPTX y muchos otros, sin necesidad de software de terceros.
Aprender más
About illustration

¿Listo para empezar?

Descargue GroupDocs.Parser gratis u obtenga una licencia de prueba para obtener acceso completo.

Recursos útiles

Explore la documentación, las muestras de código y el apoyo de la comunidad para mejorar su experiencia.

Formatos soportados para extracción de tablas

GroupDocs.Parser puede extraer datos de tablas de una variedad de tipos de documentos. A continuación se presentan los formatos más utilizados para el análisis estructurado de tablas.

Consejos para licencias temporales

1
Regístrate con tu correo electrónico del trabajo. No se permiten servicios de correo gratuitos.
2
Utilice el botón Obtener una licencia temporal en el segundo paso.
 Español