GroupDocs.Parser for Java

Extraia hiperlinks de RTF com Java

Extraia links da web e hiperlinks de PDFs, arquivos Word, planilhas Excel e outros documentos utilizando GroupDocs.Parser em seu ambiente Java.

Como extrair hiperlinks de Rtf em Java

GroupDocs.Parser simplifica a extração de hiperlinks de arquivos RTF em aplicações Java com estes passos básicos:

  1. Abra o arquivo RTF usando uma instância do Parser.
  2. Assegure-se de que a extração de hiperlinks está disponível para o formato do arquivo.
  3. Extraia todos os hiperlinks utilizando o método apropriado.
  4. Percorra os resultados e processe cada link conforme necessário.
// Carregue o arquivo que pode conter hiperlinks utilizando o Parser
try (Parser parser = new Parser("input.rtf")) {

    // Verifique se o formato do documento suporta a extração de hiperlinks
    if (!parser.getFeatures().isHyperlinks()) {
        System.out.println("A extração de hiperlinks não está disponível para o arquivo");
        return;
    }

    // Extraia e utilize os dados de hiperlink do documento
    Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks();

    for (PageHyperlinkArea h : hyperlinks) {
        System.out.println(h.getText());
        System.out.println(h.getUrl());
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
clique para copiar
copiado
Mais exemplos Documentação

Ferramentas abrangentes de análise de documentos

Além de extrair hiperlinks, GroupDocs.Parser permite coletar outros conteúdos úteis, como texto simples, mídia incorporada e dados estruturados para uso em fluxos de trabalho automatizados.

Extração de hiperlinks e análise de documentos

Detecção precisa de links

Capture todos os tipos de hiperlinks de diferentes layouts de documentos, incluindo texto clicável e URLs ocultas.

Funciona com documentos e conteúdo da web

Extraia links de arquivos PDF, DOCX, XLSX, HTML e imagens que contêm hiperlinks incorporados.

Comportamento de extração personalizada

Refine como os hiperlinks são extraídos utilizando opções como intervalos de páginas, tipos de links ou filtros de conteúdo.

Exemplo: extraindo hiperlinks de um PDF com opções personalizadas

Este exemplo demonstra como extrair todos os links de um arquivo PDF utilizando configurações de extração de links.

Java

//  Abra o PDF utilizando a classe Parser
try (Parser parser = new Parser("input.docx"))
{
    // Verifique se o suporte a hiperlinks está habilitado para este documento
    if (!parser.getFeatures().isHyperlinks()) {
        return;
    }

    // Aplique opções para filtrar links
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // Use o parser para obter dados de hiperlink
    Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks(options);

    // Itere pelos links e manuseie-os conforme necessário
    for (PageHyperlinkArea h : hyperlinks) {
        System.out.println(h.getText());
        System.out.println(h.getUrl());
    }
}

Sobre a API GroupDocs.Parser for Java

GroupDocs.Parser é uma API robusta de extração de conteúdo projetada para desenvolvedores Java. Oferece ferramentas para extrair hiperlinks, dados estruturados, imagens e texto de formatos populares como DOCX, XLSX, PDF, HTML e mais—tudo sem precisar de plugins externos.
Saiba mais
About illustration

Pronto para começar?

Baixe GroupDocs.Parser gratuitamente ou obtenha uma licença de teste para acesso total!

Recursos úteis

Explore a documentação, as amostras de código e o apoio da comunidade para aprimorar sua experiência.

Formatos de documentos que suportam extração de hiperlinks

Com GroupDocs.Parser, você pode extrair hiperlinks de muitos formatos de arquivo amplamente utilizados. Abaixo está uma lista de formatos normalmente suportados.

Dicas de licença temporária

1
Cadastre-se com seu e-mail comercial. Serviços de e-mail gratuitos não são permitidos.
2
Use o botão Obter uma licença temporária na segunda etapa.
 Português