GroupDocs.Parser para Java es una API de extracción de texto, imágenes y metadatos que admite más de 50 tipos de documentos populares para ayudar a crear aplicaciones comerciales con funciones de análisis de texto sin procesar, estructurado y formateado. También admite el análisis de documentos utilizando plantillas predefinidas y permite extraer datos complejos de facturas y otros documentos típicos con rapidez y precisión. GroupDocs.Parser para Java le permite extraer texto y metadatos de archivos protegidos con contraseña de todos los formatos populares, incluidos documentos de procesamiento de texto, hojas de cálculo de Excel, presentaciones de PowerPoint, OneNote, archivos PDF y archivos ZIP.
Contar estadísticamente la ocurrencia de palabras para documentos individuales o múltiples
Extraiga texto y metadatos de hojas de cálculo de Excel y plantillas de presentación de PowerPoint
Obtener texto de un archivo o flujo, sin instalar el lector de documentos
Pull Out Formatted Text from a Document Using Fast or Standard Extracción de texto Mode
Detecte el tipo de medio de documentos XML protegidos con contraseña y extraiga texto de ellos
Obtenga texto con formato de una presentación de PowerPoint, correos electrónicos y archivos adjuntos mediante programación
Expulsar texto de una o varias páginas del documento de OneNote
Saque el texto sin procesar de un archivo PDF simple o un documento de cartera PDF
Extraiga datos de PDF, MS Word, Excel y documentos de presentación
Extraiga texto sin procesar o formateado de celdas, filas y columnas de la hoja de cálculo de Excel
Recopile texto sin procesar o con formato HTML de un documento de Word y extraiga el texto resaltado de los documentos
Obtenga datos de los formularios PDF y obtenga una tabla con formato de un documento PDF o Word
Extraiga una sola oración o texto completo de archivos EPUB, CHM, Markdown y FB2
Recuperar área de texto de documentos para análisis y extracción de texto con su estructura de contenido intacta
Obtener metadatos de formatos de documentos admitidos
Extraiga todas las imágenes o las seleccionadas de los formatos admitidos y gire las imágenes extraídas
Extract Text from Files within Zip Archives & OST Containers – Detectar tipo de medios for Zip Container Items
Obtener datos del contenedor de correo electrónico (Exchange Web Server, POP3, IMAP)
Take Out Text from Base de datos Containers in Fast, Reliable and Efficient Manner
Encuentre texto simple, palabra completa y expresión regular dentro de los documentos
Prepare la plantilla del documento, extraiga datos del documento y analice campos y tablas de datos
Buscar y extraer expresiones resaltadas en documentos
Saque el texto con formateador de texto sin formato (simple y ASCII) o formato personalizado con bordes, ángulos e intersecciones
Obtenga y formatee texto (fuente, hipervínculos, encabezados, listas y tablas) con Markdown Formatter
Obtenga texto con formateador HTML y aplique formateador a párrafos, hipervínculos, fuentes, encabezados, listas y tablas
Mueva el diseño de la tabla y detecte las tablas en un área rectangular por separadores de columnas
Extract Text from Shapes, WordArt Objects & Text Boxes within oficina de Microsoft File Formats
Con GroupDocs.Parser para Java, puede aplicar varios formateadores al texto y HTML. Puede extraer texto con el Formateador de texto sin formato tanto para Sencillo como para ASCII. También puede obtener texto con HTML Formatter y aplicar formato a párrafos, hipervínculos, fuentes, encabezados, listas y tablas.