Этот пример демонстрирует, как извлечь все ссылки из PDF файла, используя настройки извлечения ссылок.
Java
// Откройте PDF с помощью класса Parser.
try (Parser parser = new Parser("input.docx"))
{
// Проверьте, включена ли поддержка гиперссылок для этого документа.
if (!parser.getFeatures().isHyperlinks()) {
return;
}
// Примените параметры для фильтрации ссылок.
PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));
// Используйте парсер для получения данных гиперссылок.
Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks(options);
// Итерация по ссылкам и их соответствующая обработка.
for (PageHyperlinkArea h : hyperlinks) {
System.out.println(h.getText());
System.out.println(h.getUrl());
}
}