GroupDocs.Parser for .NET

C#を使用したXLSXからのハイパーリンク抽出

GroupDocs.Parserを使用して、PDF、Word、ExcelなどのドキュメントタイプからURLおよびハイパーリンクを検出し、抽出します。これを.NETアプリケーションで行います。

C#におけるXlsxからハイパーリンクを抽出する手順

GroupDocs.Parserは、.NET開発者がXLSXファイルからハイパーリンクを抽出するための簡単な手順を提供します:

  1. Parserインスタンスを使用してXLSXファイルを読み込む。
  2. ドキュメントがハイパーリンク抽出をサポートしているか確認する。
  3. ドキュメントからハイパーリンクのリストを取得する。
  4. 結果をループ処理し、抽出したURLを扱う。
// Parserクラスを使用してハイパーリンクを含むドキュメントを読み込む
using (Parser parser = new Parser("input.xlsx")) {

    // ファイルがハイパーリンク抽出をサポートしているか確認する
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("ファイルに対してハイパーリンク抽出は利用できません");
        return;
    }

    // 抽出したハイパーリンクを取得し、処理する
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();

    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}
dotnet add package GroupDocs.Parser
クリックしてコピー
コピーしました
さらなる例 ドキュメンテーション

高度な文書解析機能

ハイパーリンク抽出に加えて、GroupDocs.Parserはテキスト、メタデータ、画像、構造化データを抽出でき、強力なデータ処理ワークフローをサポートします。

ハイパーリンク検出と文書解析

ドキュメントからのハイパーリンク検出

PDF、Wordファイル、スプレッドシートなどのドキュメントから、URLとリンクアノテーションを迅速に抽出します。

ウェブリンクと埋め込みリンクのサポート

複数のフォーマットで、標準のウェブURLと埋め込みドキュメントリンクの両方を検出して抽出します。

柔軟な解析オプション

特定のセクションやページをスキャンするための抽出設定をカスタマイズし、パフォーマンスと精度を向上させます。

リンクオプションを使用したPDFからのハイパーリンク抽出方法

このコードサンプルは、カスタムオプションを使用してPDFファイルからすべてのハイパーリンクを抽出する方法を示します。

C#

//  PDFドキュメントでParserを初期化する
using (Parser parser = new Parser("input.docx"))
{
    // ハイパーリンク抽出がサポートされているか確認する
    if (!parser.Features.Hyperlinks)
    {
        return;
    }

    // 結果を絞り込むためにリンク抽出オプションを設定する
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // ドキュメントからハイパーリンクデータを抽出する
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(options);

    // 抽出したリンクのリストを処理する
    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}

GroupDocs.Parser for .NET APIについて

GroupDocs.Parserは、.NET開発者向けの多用途の文書解析APIです。PDF、Word、Excel、HTMLなどのさまざまなファイル形式からハイパーリンク、テキスト、画像、構造化されたコンテンツを抽出することができ、外部ソフトウェアには依存しません。
詳細はこちら
About illustration

始める準備はできていますか?

GroupDocs.Parser を無料でダウンロードするか、フルアクセス用の試用版ライセンスを取得してください。

有用なリソース

ドキュメント、コードサンプル、コミュニティサポートを調べて、体験を向上させます。

ハイパーリンク抽出に対応するフォーマット

GroupDocs.Parserは、さまざまな文書タイプからハイパーリンクを抽出できます。以下に一般的にサポートされているフォーマットを示します。

一時ライセンスのヒント

1
職場の電子メールで登録してください。フリー メール サービスは使用できません。
2
2 番目のステップで [一時ライセンスを取得] ボタンを使用します。
 日本