GroupDocs.Parser for Java

Estrai collegamenti ipertestuali da EPUB con Java

Estrai collegamenti web e collegamenti ipertestuali da file PDF, documenti Word, fogli Excel e altri documenti utilizzando GroupDocs.Parser nel tuo ambiente Java.

Come estrarre collegamenti ipertestuali da Epub in Java

GroupDocs.Parser semplifica l’estrazione di collegamenti ipertestuali da file EPUB nelle applicazioni Java con questi passaggi fondamentali:

  1. Apri il file EPUB utilizzando un’istanza di Parser.
  2. Assicurati che l’estrazione dei collegamenti ipertestuali sia disponibile per il formato del file.
  3. Estrai tutti i collegamenti ipertestuali utilizzando il metodo appropriato.
  4. Scorri i risultati e processa ogni collegamento come necessario.
// Carica il file che può contenere collegamenti ipertestuali utilizzando Parser
try (Parser parser = new Parser("input.epub")) {

    // Controlla se il formato del documento supporta l'analisi dei collegamenti ipertestuali
    if (!parser.getFeatures().isHyperlinks()) {
        System.out.println("L'estrazione dei collegamenti ipertestuali non è disponibile per il file");
        return;
    }

    // Estrai e utilizza i dati dei collegamenti ipertestuali dal documento
    Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks();

    for (PageHyperlinkArea h : hyperlinks) {
        System.out.println(h.getText());
        System.out.println(h.getUrl());
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
clicca per copiare
copiato
Altri esempi Documentazione

Strumenti completi per l’analisi dei documenti

Oltre ad estrarre collegamenti ipertestuali, GroupDocs.Parser ti consente di raccogliere altri contenuti utili come testo semplice, media incorporati e dati strutturati per utilizzi in flussi di lavoro automatizzati.

Estrazione di collegamenti ipertestuali e analisi dei documenti

Rilevamento preciso dei collegamenti

Cattura tutti i tipi di collegamenti ipertestuali da diversi layout di documenti, inclusi testi cliccabili e URL nascosti.

Funziona con documenti e contenuti web

Estrai collegamenti da file PDF, DOCX, XLSX, HTML e file immagine che contengono collegamenti ipertestuali incorporati.

Comportamento di estrazione personalizzato

Affina il modo in cui vengono estratti i collegamenti ipertestuali utilizzando opzioni come intervalli di pagina, tipi di collegamenti o filtri di contenuto.

Esempio: estrazione di collegamenti ipertestuali da un PDF con opzioni personalizzate

Questo esempio dimostra come estrarre tutti i collegamenti da un file PDF utilizzando impostazioni di estrazione dei collegamenti.

Java

//  Apri il PDF utilizzando la classe Parser
try (Parser parser = new Parser("input.docx"))
{
    // Verifica che il supporto dei collegamenti ipertestuali sia abilitato per questo documento
    if (!parser.getFeatures().isHyperlinks()) {
        return;
    }

    // Applica opzioni per filtrare i collegamenti
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // Usa il parser per ottenere i dati dei collegamenti ipertestuali
    Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks(options);

    // Itera tra i collegamenti e gestiscili di conseguenza
    for (PageHyperlinkArea h : hyperlinks) {
        System.out.println(h.getText());
        System.out.println(h.getUrl());
    }
}

Informazioni sull’API GroupDocs.Parser for Java

GroupDocs.Parser è un’API robusta per l’estrazione di contenuti progettata per sviluppatori Java. Offre strumenti per estrarre collegamenti ipertestuali, dati strutturati, immagini e testo da formati popolari come DOCX, XLSX, PDF, HTML e altro—il tutto senza la necessità di plugin esterni.
Scopri di più
About illustration

Pronto per iniziare?

Scarica GroupDocs.Parser gratuitamente o ottieni una licenza di prova per l’accesso completo!

Risorse utili

Esplora la documentazione, i campioni di codice e il supporto della comunità per migliorare la tua esperienza.

Formati di documento che supportano l’estrazione di collegamenti ipertestuali

Con GroupDocs.Parser, puoi estrarre collegamenti ipertestuali da molti formati file comunemente utilizzati. Di seguito è riportato un elenco di formati tipicamente supportati.

Suggerimenti per la licenza temporanea

1
Iscriviti con la tua email di lavoro. I servizi di posta gratuiti non sono consentiti.
2
Utilizza il pulsante Ottieni una licenza temporanea nel secondo passaggio.
 Italiano