GroupDocs.Parser for .NET

Trích xuất liên kết từ PPTX bằng C#

Xác định và trích xuất URL và liên kết từ PDF, Word, Excel và các loại tài liệu khác bằng GroupDocs.Parser trong các ứng dụng .NET của bạn.

Các bước để trích xuất liên kết từ Pptx trong C#

GroupDocs.Parser cho phép các nhà phát triển .NET trích xuất liên kết từ các tệp PPTX bằng cách làm theo các bước đơn giản sau:

  1. Tải tệp PPTX bằng cách sử dụng một thể hiện Parser.
  2. Kiểm tra xem tài liệu có hỗ trợ trích xuất liên kết không.
  3. Lấy danh sách các liên kết từ tài liệu.
  4. Lặp qua các kết quả và làm việc với các URL đã được trích xuất.
// Tải tài liệu chứa liên kết bằng lớp Parser
using (Parser parser = new Parser("input.pptx")) {

    // Xác minh rằng tệp hỗ trợ trích xuất liên kết
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("Không có khả năng trích xuất liên kết cho tệp này");
        return;
    }

    // Lấy và xử lý các liên kết đã được trích xuất
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();

    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}
dotnet add package GroupDocs.Parser
nhấp để sao chép
đã sao chép
Nhiều ví dụ hơn Tài liệu

Khả năng phân tích tài liệu nâng cao

Ngoài việc trích xuất liên kết, GroupDocs.Parser còn cho phép bạn trích xuất văn bản, siêu dữ liệu, hình ảnh và dữ liệu có cấu trúc — hỗ trợ các quy trình xử lý dữ liệu mạnh mẽ.

Phát hiện liên kết và phân tích tài liệu

Phát hiện liên kết từ tài liệu

Nhanh chóng trích xuất URL và chú thích liên kết từ các tài liệu như PDF, tệp Word, bảng tính và nhiều hơn nữa.

Hỗ trợ liên kết web và nhúng

Phát hiện và trích xuất cả URL web tiêu chuẩn và liên kết tài liệu nhúng trên nhiều định dạng.

Tùy chọn phân tích linh hoạt

Tùy chỉnh cài đặt trích xuất để quét các phần hoặc trang cụ thể nhằm cải thiện hiệu suất và độ chính xác.

Cách trích xuất liên kết từ PDF bằng tùy chọn liên kết

Ví dụ mã này cho thấy cách trích xuất tất cả liên kết từ tệp PDF bằng cách sử dụng các tùy chọn tùy chỉnh.

C#

//  Khởi tạo Parser với tài liệu PDF
using (Parser parser = new Parser("input.docx"))
{
    // Kiểm tra xem trích xuất liên kết có được hỗ trợ không
    if (!parser.Features.Hyperlinks)
    {
        return;
    }

    // Đặt tùy chọn trích xuất liên kết để thu hẹp kết quả
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // Trích xuất dữ liệu liên kết từ tài liệu
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(options);

    // Xử lý danh sách các liên kết đã được trích xuất
    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}

Giới thiệu về API GroupDocs.Parser for .NET

GroupDocs.Parser là một API phân tích tài liệu linh hoạt dành cho các nhà phát triển .NET. Nó hỗ trợ trích xuất liên kết, văn bản, hình ảnh và nội dung có cấu trúc từ nhiều định dạng tệp khác nhau như PDF, Word, Excel, HTML và hơn thế nữa — mà không cần dựa vào phần mềm bên ngoài.
Tìm hiểu thêm
About illustration

Sẵn sàng để bắt đầu?

Tải xuống GroupDocs.Parser miễn phí hoặc nhận giấy phép dùng thử để có toàn quyền truy cập!

Tài nguyên hữu ích

Khám phá tài liệu, mẫu mã và hỗ trợ cộng đồng để nâng cao trải nghiệm của bạn.

Các định dạng được hỗ trợ cho việc trích xuất liên kết

GroupDocs.Parser có thể trích xuất liên kết từ nhiều loại tài liệu khác nhau. Dưới đây là các định dạng thường được hỗ trợ.

Lời khuyên về giấy phép tạm thời

1
Đăng ký bằng email công việc của bạn. Dịch vụ thư miễn phí không được phép.
2
Sử dụng nút Nhận giấy phép tạm thời ở Bước thứ hai.
 Tiếng Việt