Гиперссылка — это фрагмент текста, изображение или значок, который указывает на весь документ или на определенную часть документа. Использование гиперссылок позволяет пользователям переходить на веб-страницу или документ. Часто требуется извлечь гиперссылки из документа и использовать их для доступа к внешнему документу или веб-странице. GroupDocs.Parser for .NET – это увлекательный API для извлечения текста из документов, который предоставляет полную функциональность для реализации решений для извлечения текста и метаданных. Он поддерживает извлечение текста и гиперссылок из PDF, электронных писем, электронных книг, форматов Microsoft Office: Word (DOC, DOCX), PowerPoint (PPT, PPTX), Excel (XLS, XLSX), форматов LibreOffice и многих других. Он поддерживает несколько расширенных функций для анализа документов, извлечения простого и структурированного текста, поиска текста по ключевым словам, извлечения метаданных или изображений, контейнеров, а также вложений и многого другого.
GroupDocs.Parser for .NET позволяет разработчикам C# легко извлекать гиперссылки из файла PPS, выполняя несколько простых шагов. .
// Извлечение гиперссылок из файла PPS с помощью API GroupDocs.Parser
// Создайте экземпляр класса Parser
using (Parser parser = new Parser(filePath)) {
// Проверьте, поддерживает ли документ извлечение гиперссылок
if (!parser.Features.Hyperlinks) {
Console.WriteLine("Документ не поддерживает извлечение гиперссылок.");
return;
}
// Извлечь гиперссылки из документа
IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();
// Итерация по гиперссылкам
foreach (PageHyperlinkArea h in hyperlinks) {
// Распечатать текст гиперссылки
Console.WriteLine(h.Text);
// Распечатать URL-адрес гиперссылки
Console.WriteLine(h.Url);
Console.WriteLine();
}
}
GroupDocs.Parser for .NET API поддерживаются на всех основных платформах и операционных системах. Перед выполнением приведенного ниже кода убедитесь, что в вашей системе установлены следующие предварительные компоненты.
.NET API анализа документов и извлечения гиперссылок для форматов файлов и изображений. Извлеките данные для некоторых популярных форматов файлов, как указано ниже.
(Презентация PowerPoint)
(Презентация PowerPoint Open XML)
(Расширенный текстовый формат файла)
(Исходный документ LaTeX)
(Формат файла чертежа Microsoft Visio XML)
(Рисование Visio с поддержкой макросов)
(Формат файла Microsoft Visio)
(Формат файла с поддержкой макросов Microsoft Visio)
(Формат файла трафарета Visio)
(Шаблон чертежа Visio с поддержкой макросов)
(Формат файла Microsoft Visio)
(Векторное скалярное расширение)
(Шаблон чертежа Microsoft Visio)
(Надстройка Microsoft Excel с поддержкой макросов)
(Формат двоичного файла Microsoft Excel)
(Двоичный файл электронной таблицы Microsoft Excel)