La tabla es la colección de celdas dispuestas en filas y columnas. Las tablas juegan un papel muy importante en el almacenamiento y la organización de datos detallados o complicados que permiten a los usuarios leerlos y verlos fácilmente. Las tablas se pueden usar de muchas maneras, como hacer listas, comparar información, alinear datos, agrupar información, resaltar tendencias o patrones en los datos y muchas más. GroupDocs.Parser for .NET es una API útil que permite a los programadores de software desarrollar una solución para extraer tablas, texto e imágenes de varios tipos de formatos de documentos admitidos, como PDF, correos electrónicos, libros electrónicos, Word (DOC, { 318}), PowerPoint (PPT, PPTX), Excel (XLS, XLSX), formatos de correo electrónico (EML, MSG) y muchos más. La API .NET ha incluido varias funciones importantes para trabajar con tablas, como extraer todas las tablas de un documento, extraer una tabla de una página en particular, obtener datos de celdas de tabla, obtener el número total de filas y columnas de una tabla, obtener altura de fila, imprimir datos de una tabla y más.
GroupDocs.Parser for .NET facilita a los desarrolladores de C# extraer tablas de un archivo DOC mediante la implementación de unos sencillos pasos.
// Extraiga tablas del archivo DOC usando la API GroupDocs.Parser
// Crear una instancia de la clase Parser
using (Parser parser = new Parser(filePath)) {
// Compruebe si el documento admite la extracción de tablas
if (!parser.Features.Tables) {
Console.WriteLine("El documento no admite la extracción de tablas.");
return;
}
// Crear el diseño de las tablas.
TemplateTableLayout layout = new TemplateTableLayout(
new double[] { 50, 95, 275, 415, 485, 545 },
new double[] { 325, 340, 365, 395 });
// Crear las opciones para la extracción de tablas.
PageTableAreaOptions options = new PageTableAreaOptions(layout);
// Extraer tablas del documento.
IEnumerable<PageTableArea> tables = parser.GetTables(options);
// Iterar sobre tablas
foreach (PageTableArea t in tables) {
// Iterar sobre filas
for (int row = 0; row < t.RowCount; row++) {
// Iterar sobre columnas
for (int column = 0; column < t.ColumnCount; column++) {
// Obtener la celda de la tabla
PageTableAreaCell cell = t[row, column];
if (cell != null) {
// Imprimir el texto de la celda de la tabla
Console.Write(cell.Text);
Console.Write(" | ");
}
}
Console.WriteLine();
}
Console.WriteLine();
}
}
GroupDocs.Parser for .NET Las API son compatibles con todas las principales plataformas y sistemas operativos. Antes de ejecutar el código a continuación, asegúrese de tener instalados los siguientes requisitos previos en su sistema.
.NET API de análisis de documentos y escaneo de tablas para formatos de archivo e imágenes. Extraiga datos para algunos de los formatos de archivo populares como se indica a continuación.
(Microsoft Word 2007 Marco File)
(Office 2007+ Word Document)
(Microsoft Word Template Files)
(Microsoft Word 2007+ Template File)
(Microsoft Word Template File )
(Open eBook File)
(Hyper Text Markup Language)
(MHTML Web Archive)
(Web Page Archive Format)
(OpenDocument Presentation Format)
(OpenDocument Spreadsheet)
(OpenDocument Text File Format)
(OneNote Document)
(OpenDocument Standard Format)
(OpenDocument Standard Format)
(Portable Document Format)