GroupDocs.Parser for Java

Extraer hipervínculos de TXT con Java

Obtén enlaces web y hipervínculos de archivos PDF, documentos de Word, hojas de Excel y otros documentos utilizando GroupDocs.Parser en tu entorno Java.

Cómo extraer hipervínculos de Txt en Java

GroupDocs.Parser simplifica la extracción de hipervínculos de archivos TXT en aplicaciones Java con estos pasos básicos:

  1. Abre el archivo TXT utilizando una instancia de Parser.
  2. Asegúrate de que la extracción de hipervínculos esté disponible para el formato de archivo.
  3. Extrae todos los hipervínculos utilizando el método apropiado.
  4. Recorre los resultados y procesa cada enlace según sea necesario.
// Carga el archivo que puede contener hipervínculos utilizando el Parser
try (Parser parser = new Parser("input.txt")) {

    // Verifica si el formato del documento admite el análisis de hipervínculos
    if (!parser.getFeatures().isHyperlinks()) {
        System.out.println("La extracción de hipervínculos no está disponible para el archivo");
        return;
    }

    // Extrae y utiliza los datos de hipervínculos del documento
    Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks();

    for (PageHyperlinkArea h : hyperlinks) {
        System.out.println(h.getText());
        System.out.println(h.getUrl());
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
haga clic para copiar
copiado
Más ejemplos Documentación

Herramientas de análisis de documentos completas

Además de extraer hipervínculos, GroupDocs.Parser te permite recopilar otro contenido útil como texto plano, medios incrustados y datos estructurados para su uso en flujos de trabajo automatizados.

Extracción de hipervínculos y análisis de documentos

Detección precisa de enlaces

Captura todo tipo de hipervínculos de diferentes diseños de documentos, incluidos textos clicables y URLs ocultas.

Funciona con documentos y contenido web

Extrae enlaces de archivos PDF, DOCX, XLSX, HTML y archivos de imagen que contienen hipervínculos incrustados.

Comportamiento de extracción personalizado

Refina cómo se extraen los hipervínculos utilizando opciones como rangos de páginas, tipos de enlace o filtros de contenido.

Ejemplo: extrayendo hipervínculos de un PDF con opciones personalizadas

Este ejemplo demuestra cómo extraer todos los enlaces de un archivo PDF utilizando configuraciones de extracción de enlaces.

Java

//  Abre el PDF utilizando la clase Parser
try (Parser parser = new Parser("input.docx"))
{
    // Verifica que el soporte para hipervínculos esté habilitado para este documento
    if (!parser.getFeatures().isHyperlinks()) {
        return;
    }

    // Aplica opciones para filtrar enlaces
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // Utiliza el parser para obtener datos de hipervínculos
    Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks(options);

    // Itera a través de los enlaces y trátalos en consecuencia
    for (PageHyperlinkArea h : hyperlinks) {
        System.out.println(h.getText());
        System.out.println(h.getUrl());
    }
}

Acerca de la API GroupDocs.Parser for Java

GroupDocs.Parser es una API robusta de extracción de contenido diseñada para desarrolladores de Java. Ofrece herramientas para extraer hipervínculos, datos estructurados, imágenes y texto de formatos populares como DOCX, XLSX, PDF, HTML y más—todo sin necesidad de plugins externos.
Aprender más
About illustration

¿Listo para empezar?

Descargue GroupDocs.Parser gratis u obtenga una licencia de prueba para obtener acceso completo.

Recursos útiles

Explore la documentación, las muestras de código y el apoyo de la comunidad para mejorar su experiencia.

Formatos de documento que soportan la extracción de hipervínculos

Con GroupDocs.Parser, puedes extraer hipervínculos de muchos formatos de archivo comúnmente utilizados. A continuación se presenta una lista de formatos que normalmente son compatibles.

Consejos para licencias temporales

1
Regístrate con tu correo electrónico del trabajo. No se permiten servicios de correo gratuitos.
2
Utilice el botón Obtener una licencia temporal en el segundo paso.
 Español