GroupDocs.Parser en un vistazo

API para realizar análisis de documentos en aplicaciones .NET.

Illustration parser

Extraer datos de documentos

La API GroupDocs.Parser for .NET permite recuperar texto, metadatos e imágenes de una amplia gama de formatos de archivo, como documentos de Office, correos electrónicos, archivos adjuntos y archivos comprimidos. Esta herramienta potente le ayuda a acceder y procesar eficientemente la información valiosa contenida dentro de estos archivos para varias aplicaciones, como análisis de datos, indexación de motores de búsqueda o sistemas de gestión de contenido.

Analizar documentos

Extraiga varios elementos como hipervínculos, tablas, códigos QR, códigos de barras y datos de formularios PDF. También analice cualquier información deseada de documentos utilizando plantillas personalizadas.

Personalización de resultados

La API .NET le permite recuperar datos en varios formatos, como bruto, estructurado, HTML o Markdown. Además, la API ofrece una funcionalidad de búsqueda para localizar palabras o frases específicas dentro del texto de los documentos.

Independencia de la plataforma

La API GroupDocs.Parser for .NET es compatible con los siguientes sistemas operativos, marcos de trabajo y gerentes de paquetes.

Amazon
Docker
Azure
VS Code
ReSharper
macOS
Linux
NuGet

Formatos de archivo compatibles

GroupDocs.Parser for .NET admite operaciones con los siguientes formatos de archivo.

Formatos de Microsoft Office

  • Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
  • Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

Imágenes y otros formatos

  • Portátiles: PDF
  • Imágenes: JPG, BMP, PNG, TIFF, GIF
  • Otros formatos de oficina: ODT, OTT, OTS, ODS, ODP, OTP, ODG

Otros formatos

  • Web: HTML, MHTML
  • Archivos: ZIP, TAR, 7Z
  • e-Libros: CHM, EPUB, FB2, MOBI

Características de GroupDocs.Parser for .NET

Extraiga datos de PDF, documentos de Office e imágenes de manera rápida y precisa.

Feature icon

Extraer texto

Extraiga información textual de varios formatos de archivo como documentos de oficina, archivos PDF e imágenes para una fácil legibilidad y análisis.

Feature icon

Extraer imágenes

Recupere contenido visual de diversas fuentes, como documentos de oficina y archivos PDF, para un acceso y uso conveniente.

Feature icon

Escanear códigos QR

Detecte y decodifique códigos QR presentes en documentos de oficina, archivos PDF o contenido visual para una eficiente recuperación de información.

Feature icon

Extraer datos de archivos adjuntos de correo electrónico y archivos comprimidos

Reúna información valiosa de mensajes de correo electrónico, archivos adjuntos y fuentes de datos comprimidos para un análisis y utilización efectiva.

Feature icon

Extraer tablas

Identifique y extraiga datos tabulares de documentos PDF para un análisis y uso organizado.

Feature icon

Extraer hipervínculos

Ubique y extraiga hipervínculos y direcciones de correo electrónico dentro de documentos de oficina o archivos PDF para un acceso eficiente.

Feature icon

Analizar formularios PDF

Los formularios PDF son documentos digitales con campos rellenables para la interacción del usuario, permitiendo ingresar información electrónicamente. La API .NET puede ser utilizada para extraer datos de estos formularios para un procesamiento eficiente.

Feature icon

Analizar datos por plantillas

Cree plantillas personalizadas y utilícelas con la API .NET para analizar información específica de archivos PDF, simplificando los procesos de extracción de datos.

Feature icon

Buscar un texto en documentos

Localice rápidamente palabras o patrones específicos dentro de los documentos.

Ejemplos de código

Algunos casos de uso de operaciones típicas de GroupDocs.Parser for .NET

Extraer imágenes de documentos PDF

GroupDocs.Parser for .NET facilita a los desarrolladores C# extraer imágenes de documentos:

Extraer imágenes de documentos PDF en C#

// Cree una instancia de la clase Parser.
using (var parser = new Parser("source.pptx"))
{
    // Extraiga imágenes.
    var images = parser.GetImages();

    // Verifique si se extrajo algo.
    if (images == null)
    {
        return;
    }
    // Itere sobre las imágenes.
    foreach (PageImageArea image in images)
    {
        // Imprima el índice de la página, rectángulo y tipo de imagen.
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}

Extraer códigos de barras de imágenes

Utilice nuestra API .NET para extraer códigos de barras de imágenes:

Extraer códigos de barras de imágenes en C#

// Cargue la imagen fuente en Parser.
using (var parser = new Parser("source.jpg"))
{
    // Verifique si el archivo es compatible con la extracción de códigos de barras.
    if (parser.Features.Barcodes)
    {
        // Extraiga códigos de barras del archivo.
        var barcodes = parser.GetBarcodes();

        // Itere sobre los códigos de barras.
        foreach (var barcode in barcodes)
        {
            // Imprima el índice de la página.
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // Imprima el valor del código de barras.
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

¿Listo para empezar?

Descargue GroupDocs.Parser gratis u obtenga una licencia de prueba para obtener acceso completo.

Recursos útiles

Explore la documentación, las muestras de código y el apoyo de la comunidad para mejorar su experiencia.

Consejos para licencias temporales

1
Regístrate con tu correo electrónico del trabajo. No se permiten servicios de correo gratuitos.
2
Utilice el botón Obtener una licencia temporal en el segundo paso.
 Español