GroupDocs.Parser for Java

Ekstrak hyperlink dari XML dengan Java

Ambil tautan web dan hyperlink dari file PDF, dokumen Word, lembar Excel, dan dokumen lainnya menggunakan GroupDocs.Parser di lingkungan Java Anda.

Cara mengekstrak hyperlink dari Xml dalam Java

GroupDocs.Parser menyederhanakan ekstraksi hyperlink dari file XML dalam aplikasi Java dengan langkah-langkah dasar berikut:

  1. Buka file XML menggunakan instance dari Parser.
  2. Pastikan ekstraksi hyperlink tersedia untuk format file.
  3. Ekstrak semua hyperlink menggunakan metode yang sesuai.
  4. Iterasikan hasil dan proses setiap tautan sesuai kebutuhan.
// Muat file yang mungkin berisi hyperlink menggunakan Parser
try (Parser parser = new Parser("input.xml")) {

    // Periksa apakah format dokumen mendukung penguraian hyperlink
    if (!parser.getFeatures().isHyperlinks()) {
        System.out.println("Ekstraksi hyperlink tidak tersedia untuk file ini");
        return;
    }

    // Ekstrak dan gunakan data hyperlink dari dokumen
    Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks();

    for (PageHyperlinkArea h : hyperlinks) {
        System.out.println(h.getText());
        System.out.println(h.getUrl());
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
klik untuk menyalin
disalin
Lebih banyak contoh Dokumentasi

Alat pemrosesan dokumen yang komprehensif

Selain mengekstrak hyperlink, GroupDocs.Parser memungkinkan Anda mengumpulkan konten berguna lainnya seperti teks biasa, media terbenam, dan data terstruktur untuk digunakan dalam alur kerja otomatis.

Ekstraksi hyperlink dan analisis dokumen

Deteksi tautan yang akurat

Tangkap semua jenis hyperlink dari berbagai tata letak dokumen, termasuk teks yang dapat diklik dan URL tersembunyi.

Bekerja dengan dokumen dan konten web

Ambil tautan dari file PDF, DOCX, XLSX, HTML, dan file gambar yang berisi hyperlink terbenam.

Perilaku ekstraksi khusus

Sempurnakan cara hyperlink diekstrak menggunakan opsi seperti rentang halaman, jenis tautan, atau filter konten.

Contoh: mengekstrak hyperlink dari PDF dengan opsi khusus

Contoh ini menunjukkan cara mengekstrak semua tautan dari file PDF menggunakan pengaturan ekstraksi tautan.

Java

//  Buka PDF menggunakan kelas Parser
try (Parser parser = new Parser("input.docx"))
{
    // Verifikasi bahwa dukungan hyperlink diaktifkan untuk dokumen ini
    if (!parser.getFeatures().isHyperlinks()) {
        return;
    }

    // Terapkan opsi untuk memfilter tautan
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // Gunakan parser untuk mendapatkan data hyperlink
    Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks(options);

    // Iterasikan tautan dan tangani sesuai kebutuhan
    for (PageHyperlinkArea h : hyperlinks) {
        System.out.println(h.getText());
        System.out.println(h.getUrl());
    }
}

Tentang API GroupDocs.Parser for Java

GroupDocs.Parser adalah API ekstraksi konten yang kuat yang dirancang untuk pengembang Java. Ini menawarkan alat untuk mengekstrak hyperlink, data terstruktur, gambar, dan teks dari format populer seperti DOCX, XLSX, PDF, HTML, dan banyak lagi—semua tanpa memerlukan plugin eksternal.
Pelajari lebih lanjut
About illustration

Siap untuk memulai?

Unduh GroupDocs.Parser secara gratis atau dapatkan lisensi uji coba untuk akses penuh!

Sumber daya yang berguna

Jelajahi dokumentasi, sampel kode, dan dukungan masyarakat untuk meningkatkan pengalaman Anda.

Format dokumen yang mendukung ekstraksi hyperlink

Dengan GroupDocs.Parser, Anda dapat mengekstrak hyperlink dari banyak format file yang umum digunakan. Berikut adalah daftar format yang biasanya didukung.

Tip lisensi sementara

1
Daftar dengan email kantor Anda. Layanan email gratis tidak diperbolehkan.
2
Gunakan tombol Dapatkan lisensi sementara pada langkah kedua.
 Indonesian