ハイパーリンクは、文書全体または文書内の特定の部分を指すテキスト、画像、またはアイコンです。ハイパーリンクを使用すると、ユーザーは Web ページまたはドキュメントに移動できます。多くの場合、ドキュメントからハイパーリンクを抽出し、それを使用して外部ドキュメントまたは Web ページにアクセスすることが必要になります。 GroupDocs.Parser for .NET は、テキストおよびメタデータ抽出ソリューションを実装するための完全な機能を提供する魅力的なドキュメント テキスト抽出 API です。 PDF、メール、電子書籍、Microsoft Office 形式からのテキストとハイパーリンクの抽出をサポートしています: Word (DOC、DOCX)、PowerPoint (PPT、PPTX)、Excel ( XLS、XLSX)、LibreOffice 形式など。ドキュメントの解析、プレーンテキストと構造化テキストの抽出、キーワードによるテキスト検索、メタデータや画像、コンテナや添付ファイルの抽出など、いくつかの高度な機能をサポートしています。
GroupDocs.Parser for .NET を使用すると、C# 開発者は、いくつかの簡単な手順を実装することで、OTP ファイルからハイパーリンクを簡単に抽出できます。
// GroupDocs.Parser API を使用して OTP ファイルからハイパーリンクを抽出します
// Parserクラスのインスタンスを作成する
using (Parser parser = new Parser(filePath)) {
// ドキュメントがハイパーリンク抽出をサポートしているかどうかを確認する
if (!parser.Features.Hyperlinks) {
Console.WriteLine("ドキュメントはハイパーリンク抽出をサポートしていません。");
return;
}
// ドキュメントからハイパーリンクを抽出する
IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();
// ハイパーリンクを反復処理する
foreach (PageHyperlinkArea h in hyperlinks) {
// ハイパーリンクのテキストを印刷する
Console.WriteLine(h.Text);
// ハイパーリンクの URL を出力する
Console.WriteLine(h.Url);
Console.WriteLine();
}
}
GroupDocs.Parser for .NET API は、すべての主要なプラットフォームとオペレーティング システムでサポートされています。以下のコードを実行する前に、次の前提条件がシステムにインストールされていることを確認してください。
.NET ドキュメントは、ファイル形式と画像の解析とハイパーリンク抽出 API を使用します。以下に示すように、いくつかの一般的なファイル形式のデータを抽出します。
(Portable Document Format)
(PowerPoint Slide Show)
(PowerPoint Slide Show)
(Microsoft PowerPoint 97-2003)
(Open XML presentation Format)
(Rich Text Format)
(LaTeX Source Document)
(The 7th Guest Video File)
(Visio Macro-Enabled Drawing)
(Visio Drawing)
(Visio Macro-Enabled Stencil File)
(Visio Stencil File)
(Visio Macro-Enabled Drawing Template)
(Visio Drawing Template)
(Visio Stencil XML File)
(Anim8or 3D Model)