Mẫu này minh họa cách trích xuất tất cả các liên kết từ một tệp PDF bằng cách sử dụng các thiết lập trích xuất liên kết.
Java
// Mở PDF bằng lớp Parser
try (Parser parser = new Parser("input.docx"))
{
// Xác minh rằng hỗ trợ liên kết đã được bật cho tài liệu này
if (!parser.getFeatures().isHyperlinks()) {
return;
}
// Áp dụng các tùy chọn để lọc các liên kết
PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));
// Sử dụng trình phân tích để lấy dữ liệu liên kết
Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks(options);
// Lặp qua các liên kết và xử lý chúng theo cách cần thiết
for (PageHyperlinkArea h : hyperlinks) {
System.out.println(h.getText());
System.out.println(h.getUrl());
}
}