製品
/ GroupDocs.Parser
/ .NET
/ .NET の OTP からハイパーリンクを抽出します

C#/VB API 経由でドキュメント、ページ、または特定のページ領域からハイパーリンクを抽出します。

GroupDocs.Parser .NET API を使用すると、ソフトウェア開発者はドキュメント、ページ、またはページ領域 PDF、DOC、DOCX、PPT、PPTX、EML、MSG からハイパーリンクを解析して抽出できます。、XLS、XLSX、CSV、ODT、RTF、EPUB、その他多くのドキュメント。

.NET API 経由で OTP ドキュメントからハイパーリンクを解析して抽出するにはどうすればよいですか?

ハイパーリンクは、文書全体または文書内の特定の部分を指すテキスト、画像、またはアイコンです。ハイパーリンクを使用すると、ユーザーは Web ページまたはドキュメントに移動できます。多くの場合、ドキュメントからハイパーリンクを抽出し、それを使用して外部ドキュメントまたは Web ページにアクセスすることが必要になります。 GroupDocs.Parser for .NET は、テキストおよびメタデータ抽出ソリューションを実装するための完全な機能を提供する魅力的なドキュメントテキスト抽出 API です。 PDF、メール、電子書籍、Microsoft Office 形式からのテキストとハイパーリンクの抽出をサポートしています: Word (DOC、DOCX)、PowerPoint (PPT、PPTX)、Excel ( XLS、XLSX)、LibreOffice 形式など。ドキュメントの解析、プレーンテキストと構造化テキストの抽出、キーワードによるテキスト検索、メタデータや画像、コンテナや添付ファイルの抽出など、いくつかの高度な機能をサポートしています。

.NET の OTP からハイパーリンクを抽出します

GroupDocs.Parser for .NET を使用すると、C# 開発者は、いくつかの簡単な手順を実装することで、OTP ファイルからハイパーリンクを簡単に抽出できます。

最初のドキュメントの Parser オブジェクトをインスタンス化します。
ドキュメントがハイパーリンク抽出をサポートしているかどうかを確認します。
GetHyperlinks メソッドを呼び出し、PageHyperlinkArea オブジェクト。
コレクションを反復処理して、ハイパーリンクのテキストと URL を取得します。

ハイパーリンク抽出の詳細

C# サンプルコードを使用して OTP ファイルからハイパーリンクを抽出する方法

// GroupDocs.Parser API を使用して OTP ファイルからハイパーリンクを抽出します
// Parserクラスのインスタンスを作成する
using (Parser parser = new Parser(filePath)) {
    // ドキュメントがハイパーリンク抽出をサポートしているかどうかを確認する
    if (!parser.Features.Hyperlinks) {
        Console.WriteLine("ドキュメントはハイパーリンク抽出をサポートしていません。");
        return;
    }
    // ドキュメントからハイパーリンクを抽出する
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();
    // ハイパーリンクを反復処理する
    foreach (PageHyperlinkArea h in hyperlinks) {
        // ハイパーリンクのテキストを印刷する
        Console.WriteLine(h.Text);
        // ハイパーリンクの URL を出力する
        Console.WriteLine(h.Url);
        Console.WriteLine();
    }
}