超链接是指向整个文档或文档中特定部分的一段文本、图像或图标。使用超链接允许用户导航到网页或文档。通常需要从文档中提取超链接并使用它来访问外部文档或网页。 GroupDocs.Parser for .NET 是一个令人着迷的文档文本提取 API,它提供了用于实施文本和元数据提取解决方案的完整功能。它支持从 PDF、电子邮件、电子书、Microsoft Office 格式中提取文本和超链接:Word (DOC、DOCX)、PowerPoint (PPT、PPTX)、Excel ( XLS、XLSX)、LibreOffice 格式等等。它支持多种高级功能,用于文档解析、提取纯文本和结构化文本、按关键字搜索文本、提取元数据或图像、容器以及附件等等。
GroupDocs.Parser for .NET 让 C# 开发者只需执行几个简单的步骤即可轻松从 OTP 文件中提取超链接。
// 使用 GroupDocs.Parser API 从 OTP 文件中提取超链接
// 创建 Parser 类的实例
using (Parser parser = new Parser(filePath)) {
// 检查文档是否支持超链接提取
if (!parser.Features.Hyperlinks) {
Console.WriteLine("文档不支持超链接提取。");
return;
}
// 从文档中提取超链接
IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();
// 迭代超链接
foreach (PageHyperlinkArea h in hyperlinks) {
// 打印超链接文本
Console.WriteLine(h.Text);
// 打印超链接 URL
Console.WriteLine(h.Url);
Console.WriteLine();
}
}
GroupDocs.Parser for .NET 所有主要平台和操作系统均支持 API。在执行下面的代码之前,请确保您的系统上安装了以下先决条件。
.NET 针对文件格式和图像的文档解析和超链接提取 API。提取一些流行文件格式的数据,如下所述。
(Portable Document Format)
(PowerPoint Slide Show)
(PowerPoint Slide Show)
(Microsoft PowerPoint 97-2003)
(Open XML presentation Format)
(Rich Text Format)
(LaTeX Source Document)
(The 7th Guest Video File)
(Visio Macro-Enabled Drawing)
(Visio Drawing)
(Visio Macro-Enabled Stencil File)
(Visio Stencil File)
(Visio Macro-Enabled Drawing Template)
(Visio Drawing Template)
(Visio Stencil XML File)
(Anim8or 3D Model)