Parser para Net

SDK de Análisis de Documentos para .NET

Añade un análisis de documentos rápido y preciso a tus aplicaciones .NET y extrae texto, imágenes, metadatos y datos estructurados de documentos e imágenes.

Descargar NuGet Iniciar prueba gratuita

Versión 26.6.1 lanzada

Ver qué hay de nuevo

// Pasa el archivo fuente a la instancia de Parser
using (var parser = new Parser("source.pdf"))
{
    // Pasa el texto del documento a TextReader
    using (var textReader = parser.GetText())
    {
        // Procesa el texto del documento
        Console.WriteLine(textReader?.ReadToEnd());
    }
}

dotnet add package GroupDocs.Parser

GroupDocs.Parser en un vistazo

SDK de Análisis de Documentos para realizar un análisis de documentos de alta precisión en aplicaciones .NET

Extraer datos de documentos

GroupDocs.Parser for .NET API le permite recuperar texto, metadatos e imágenes de una amplia gama de formatos de archivo, como documentos de Office, correos electrónicos, adjuntos y archivos. Esta potente herramienta le ayuda a acceder y procesar de manera eficiente la información valiosa contenida en estos archivos para diversas aplicaciones, como análisis de datos, indexación de motores de búsqueda o sistemas de gestión de contenidos.

Analizar documentos

Extrae varios elementos como hipervínculos, tablas, códigos QR, códigos de barras y datos de formularios PDF. También analiza cualquier información deseada de los documentos utilizando plantillas personalizadas.

Personalizar resultados

.NET API le permite recuperar datos en varios formatos, como crudo, estructurado, HTML o Markdown. Además, la API ofrece una funcionalidad de búsqueda para localizar palabras o frases específicas dentro del texto de los documentos.

Independencia de plataforma

GroupDocs.Parser for .NET admite los siguientes sistemas operativos, frameworks y administradores de paquetes

Formatos de archivo compatibles

GroupDocs.Parser for .NET admite operaciones con los siguientes formatos de archivo.

Formatos de Microsoft Office

Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

Imágenes y otros formatos

Portátil: PDF
Imágenes: JPG, BMP, PNG, TIFF, GIF
Otros formatos de oficina: ODT, OTT, OTS, ODS, ODP, OTP, ODG

Otros formatos

Web: HTML, MHTML
Archivos: ZIP, TAR, 7Z
eBooks: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for .NET características

Extraiga datos de PDFs, documentos de Office, imágenes y otros formatos de forma rápida y precisa con nuestro SDK de Análisis de Documentos .NET

Extraer texto

Extrae información textual de varios formatos de archivo, como documentos de oficina, archivos PDF e imágenes, para una fácil lectura y análisis.

Extraer imágenes

Recupera contenido visual de diversas fuentes, como documentos de oficina y archivos PDF, para un acceso y uso convenientes.

Escanear códigos QR

Detecta y decodifica códigos QR presentes en documentos de oficina, archivos PDF o contenido visual para una recuperación de información eficiente.

Extraer datos de adjuntos de correo electrónico y archivos

Recopile información valiosa de mensajes de correo electrónico, archivos adjuntos y fuentes de datos comprimidos para un análisis y utilización eficaces.

Extraer tablas

Identifique y extraiga datos tabulares de documentos PDF para un análisis y uso organizados.

Extraer hipervínculos

Ubique y extraiga hipervínculos y direcciones de correo electrónico dentro de documentos de oficina o archivos PDF para un acceso eficiente.

Analizar formularios PDF

Los formularios PDF son documentos digitales con campos rellenables para la interacción del usuario, que permiten introducir información electrónicamente. La API .NET puede utilizarse para extraer datos de estos formularios para un procesamiento eficiente.

Analizar datos mediante plantillas

Cree plantillas personalizadas y utilícelas con la API .NET para analizar información específica de archivos PDF, simplificando los procesos de extracción de datos.

Buscar texto en documentos

Ubique rápidamente palabras o patrones específicos dentro de los documentos.

Ejemplos de código

Algunos casos de uso típicos de operaciones de GroupDocs.Parser for .NET

Extraer imágenes de documentos PDF

GroupDocs.Parser for .NET facilita a

los desarrolladores de C# extraer imágenes de documentos:

Extraer imágenes de documentos PDF en C#

// Cree una instancia de la clase Parser style=color:#00f>using (var parser = new Parser("source.pptx")) { // Extraer imágenes var images = parser.GetImages(); // Verifique si se ha extraído algo if (images == null) { return; } // Iterar sobre las imágenes foreach (PageImageArea image in images) { // Imprima el índice de página, el rectángulo y el tipo de imagen Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", image.Page.Index, image.Rectangle, image.FileType)); } }

`Extraer códigos de barras de imágenes`

Utilice nuestra API .NET para extraer códigos de barras de imágenes:

`Extraer códigos de barras de imágenes en C#`

// Cargue la imagen fuente en Parser
using (var parser = new Parser("source.jpg"))
{
    // Verifique si el archivo admite la extracción de códigos de barras
    if (parser.Features.Barcodes)
    {
        // Extraer códigos de barras del archivo
        var barcodes = parser.GetBarcodes();

        // Iterar sobre los códigos de barras
        foreach (var barcode in barcodes)
        {
            // Imprima el índice de página
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // Imprima el valor del código de barras
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

`¿Listo para empezar?`

Descargue GroupDocs.Parser gratis u obtenga una licencia de prueba para obtener acceso completo.

Descargar NuGet
Iniciar prueba gratuita

`Recursos útiles`

Explore la documentación, las muestras de código y el apoyo de la comunidad para mejorar su experiencia.


Documentación
Referencia de API
Muestras de código
Soporte gratuito
Apoyo pagado