API de Java Parser para extraer datos

API de Java para analizar y extraer imágenes y texto con metadatos de documentos, presentaciones, archivos y correos electrónicos.


Descargue prueba gratis

GroupDocs.Parser para Java es una API de extracción de texto, imágenes y metadatos que admite más de 50 tipos de documentos populares para ayudar a crear aplicaciones comerciales con funciones de análisis de texto sin procesar, estructurado y formateado. También admite el análisis de documentos utilizando plantillas predefinidas y permite extraer datos complejos de facturas y otros documentos típicos con rapidez y precisión. GroupDocs.Parser para Java le permite extraer texto y metadatos de archivos protegidos con contraseña de todos los formatos populares, incluidos documentos de procesamiento de texto, hojas de cálculo de Excel, presentaciones de PowerPoint, OneNote, archivos PDF y archivos ZIP.

GroupDocs.Parser for Java Características

Contar estadísticamente la ocurrencia de palabras para documentos individuales o múltiples

Extraiga texto y metadatos de hojas de cálculo de Excel y plantillas de presentación de PowerPoint

Obtener texto de un archivo o flujo, sin instalar el lector de documentos

Pull Out Formatted Text from a Document Using Fast or Standard Extracción de texto Mode

Detecte el tipo de medio de documentos XML protegidos con contraseña y extraiga texto de ellos

Obtenga texto con formato de una presentación de PowerPoint, correos electrónicos y archivos adjuntos mediante programación

Expulsar texto de una o varias páginas del documento de OneNote

Saque el texto sin procesar de un archivo PDF simple o un documento de cartera PDF

Extraiga datos de PDF, MS Word, Excel y documentos de presentación

Extraiga texto sin procesar o formateado de celdas, filas y columnas de la hoja de cálculo de Excel

Recopile texto sin procesar o con formato HTML de un documento de Word y extraiga el texto resaltado de los documentos

Obtenga datos de los formularios PDF y obtenga una tabla con formato de un documento PDF o Word

Extraiga una sola oración o texto completo de archivos EPUB, CHM, Markdown y FB2

Recuperar área de texto de documentos para análisis y extracción de texto con su estructura de contenido intacta

Obtener metadatos de formatos de documentos admitidos

Extraiga todas las imágenes o las seleccionadas de los formatos admitidos y gire las imágenes extraídas

Extract Text from Files within Zip Archives & OST Containers – Detectar tipo de medios for Zip Container Items

Obtener datos del contenedor de correo electrónico (Exchange Web Server, POP3, IMAP)

Take Out Text from Base de datos Containers in Fast, Reliable and Efficient Manner

Encuentre texto simple, palabra completa y expresión regular dentro de los documentos

Prepare la plantilla del documento, extraiga datos del documento y analice campos y tablas de datos

Buscar y extraer expresiones resaltadas en documentos

Saque el texto con formateador de texto sin formato (simple y ASCII) o formato personalizado con bordes, ángulos e intersecciones

Obtenga y formatee texto (fuente, hipervínculos, encabezados, listas y tablas) con Markdown Formatter

Obtenga texto con formateador HTML y aplique formateador a párrafos, hipervínculos, fuentes, encabezados, listas y tablas

Mueva el diseño de la tabla y detecte las tablas en un área rectangular por separadores de columnas

Extract Text from Shapes, WordArt Objects & Text Boxes within oficina de Microsoft File Formats

Obtener texto con formateadores de texto sin formato o HTML

Con GroupDocs.Parser para Java, puede aplicar varios formateadores al texto y HTML. Puede extraer texto con el Formateador de texto sin formato tanto para Sencillo como para ASCII. También puede obtener texto con HTML Formatter y aplicar formato a párrafos, hipervínculos, fuentes, encabezados, listas y tablas.

Recursos de apoyo y aprendizaje

GroupDocs.Parser ofrece API de visualización de documentos para otros entornos de desarrollo populares

Back to top
Es