Гиперссылка — это фрагмент текста, изображение или значок, который указывает на весь документ или на определенную часть документа. Использование гиперссылок позволяет пользователям переходить на веб-страницу или документ. Часто требуется извлечь гиперссылки из документа и использовать их для доступа к внешнему документу или веб-странице. GroupDocs.Parser for .NET – это увлекательный API для извлечения текста из документов, который предоставляет полную функциональность для реализации решений для извлечения текста и метаданных. Он поддерживает извлечение текста и гиперссылок из PDF, электронных писем, электронных книг, форматов Microsoft Office: Word (DOC, DOCX), PowerPoint (PPT, PPTX), Excel (XLS, XLSX), форматов LibreOffice и многих других. Он поддерживает несколько расширенных функций для анализа документов, извлечения простого и структурированного текста, поиска текста по ключевым словам, извлечения метаданных или изображений, контейнеров, а также вложений и многого другого.
GroupDocs.Parser for .NET позволяет разработчикам C# легко извлекать гиперссылки из файла OTP, выполняя несколько простых шагов. .
// Извлечение гиперссылок из файла OTP с помощью API GroupDocs.Parser
// Создайте экземпляр класса Parser
using (Parser parser = new Parser(filePath)) {
// Проверьте, поддерживает ли документ извлечение гиперссылок
if (!parser.Features.Hyperlinks) {
Console.WriteLine("Документ не поддерживает извлечение гиперссылок.");
return;
}
// Извлечь гиперссылки из документа
IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();
// Итерация по гиперссылкам
foreach (PageHyperlinkArea h in hyperlinks) {
// Распечатать текст гиперссылки
Console.WriteLine(h.Text);
// Распечатать URL-адрес гиперссылки
Console.WriteLine(h.Url);
Console.WriteLine();
}
}
GroupDocs.Parser for .NET API поддерживаются на всех основных платформах и операционных системах. Перед выполнением приведенного ниже кода убедитесь, что в вашей системе установлены следующие предварительные компоненты.
.NET API анализа документов и извлечения гиперссылок для форматов файлов и изображений. Извлеките данные для некоторых популярных форматов файлов, как указано ниже.
(Портативный документ)
(Слайд-шоу Microsoft PowerPoint)
(Слайд-шоу PowerPoint Open XML)
(Презентация PowerPoint)
(Презентация PowerPoint Open XML)
(Расширенный текстовый формат файла)
(Исходный документ LaTeX)
(Формат файла чертежа Microsoft Visio XML)
(Рисование Visio с поддержкой макросов)
(Формат файла Microsoft Visio)
(Формат файла с поддержкой макросов Microsoft Visio)
(Формат файла трафарета Visio)
(Шаблон чертежа Visio с поддержкой макросов)
(Формат файла Microsoft Visio)
(Векторное скалярное расширение)
(Шаблон чертежа Microsoft Visio)