GroupDocs.Parser for .NET

Ekstrak hyperlink dari DOCX menggunakan C#

Deteksi dan ekstrak URL serta hyperlink dari PDF, Word, Excel, dan berbagai jenis dokumen lain menggunakan GroupDocs.Parser dalam aplikasi .NET Anda.

Unduh NuGet

Mulai Uji Coba Gratis

Langkah-langkah untuk mengekstrak hyperlink dari Docx dalam C#

GroupDocs.Parser memungkinkan pengembang .NET untuk mengekstrak hyperlink dari file DOCX dengan mengikuti langkah-langkah sederhana ini:

Muat file DOCX menggunakan instance Parser.
Periksa apakah dokumen mendukung ekstraksi hyperlink.
Ambil daftar hyperlink dari dokumen.
Loop melalui hasil dan bekerja dengan URL yang diekstrak.

Salin

// Muat dokumen yang berisi hyperlink menggunakan kelas Parser
using (Parser parser = new Parser("input.docx")) {

    // Verifikasi bahwa file mendukung ekstraksi hyperlink
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("Ekstraksi hyperlink tidak tersedia untuk file ini");
        return;
    }

    // Ambil dan proses hyperlink yang diekstrak
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();

    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}

dotnet add package GroupDocs.Parser

klik untuk menyalin

disalin

Lebih banyak contoh Dokumentasi

Kemampuan parsing dokumen yang canggih

Selain ekstraksi hyperlink, GroupDocs.Parser memungkinkan Anda untuk mengekstrak teks, metadata, gambar, dan data terstruktur—mendukung alur kerja pemrosesan data yang kuat.

Deteksi hyperlink dari dokumen

Ekstrak URL dan anotasi tautan dari dokumen seperti PDF, file Word, spreadsheet, dan lainnya dengan cepat.

Dukungan untuk tautan web dan embedded

Deteksi dan ekstrak baik URL web standar maupun tautan dokumen ter嵌入 di berbagai format.

Opsi parsing yang fleksibel

Sesuaikan pengaturan ekstraksi untuk memindai bagian atau halaman tertentu untuk meningkatkan kinerja dan akurasi.

Cara mengekstrak hyperlink dari PDF menggunakan opsi tautan

Contoh kode ini menunjukkan cara mengekstrak semua hyperlink dari file PDF menggunakan opsi kustom.

C#

//  Inisialisasi Parser dengan dokumen PDF
using (Parser parser = new Parser("input.docx"))
{
    // Periksa apakah ekstraksi hyperlink didukung
    if (!parser.Features.Hyperlinks)
    {
        return;
    }

    // Tetapkan opsi ekstraksi tautan untuk mempersempit hasil
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // Ekstrak data hyperlink dari dokumen
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(options);

    // Tangani daftar tautan yang diekstrak
    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}

Tentang API GroupDocs.Parser for .NET

GroupDocs.Parser adalah API parsing dokumen yang serbaguna untuk pengembang .NET. Ini mendukung ekstraksi hyperlink, teks, gambar, dan konten terstruktur dari berbagai format file seperti PDF, Word, Excel, HTML, dan lainnya—tanpa bergantung pada perangkat lunak eksternal.

Pelajari lebih lanjut