GroupDocs.Parser for .NET

Hyperlinks aus TXT mit C# extrahieren

URLs und Hyperlinks aus PDF-, Word-, Excel- und anderen Dokumenttypen mithilfe von GroupDocs.Parser in Ihren .NET-Anwendungen erkennen und extrahieren.

Schritte zum Extrahieren von Hyperlinks aus Txt in C#

GroupDocs.Parser ermöglicht es .NET-Entwicklern, Hyperlinks aus TXT-Dateien durch Befolgung dieser einfachen Schritte zu extrahieren:

  1. TXT-Datei mit einer Parser-Instanz laden.
  2. Überprüfen Sie, ob das Dokument die Extraktion von Hyperlinks unterstützt.
  3. Die Liste der Hyperlinks aus dem Dokument abrufen.
  4. Durch die Ergebnisse iterieren und mit den extrahierten URLs arbeiten.
// Laden Sie das Dokument mit Hyperlinks unter Verwendung der Parser-Klasse
using (Parser parser = new Parser("input.txt")) {

    // Überprüfen Sie, ob die Datei die Extraktion von Hyperlinks unterstützt
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("Die Hyperlink-Extraktion ist für die Datei nicht verfügbar");
        return;
    }

    // Extrahierte Hyperlinks abrufen und verarbeiten
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();

    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}
dotnet add package GroupDocs.Parser
Klicken zum Kopieren
Kopiert
Weitere Beispiele Dokumentation

Erweiterte Dokumentenverarbeitungsfunktionen

Neben der Extraktion von Hyperlinks ermöglicht GroupDocs.Parser die Extraktion von Texten, Metadaten, Bildern und strukturierten Daten – und unterstützt leistungsstarke Datenverarbeitungs-Workflows.

Erkennung von Hyperlinks und Dokumentenverarbeitung

Erkennung von Hyperlinks aus Dokumenten

URLs und Linkannotationen schnell aus Dokumenten wie PDFs, Word-Dateien, Tabellenkalkulationen und mehr extrahieren.

Unterstützung für Web- und eingebettete Links

Standard-Web-URLs und eingebettete Dokumentenlinks über mehrere Formate hinweg erkennen und extrahieren.

Flexible Parsing-Optionen

Extraktionseinstellungen anpassen, um bestimmte Abschnitte oder Seiten zu scannen und so Leistung und Genauigkeit zu verbessern.

Wie man Hyperlinks aus einer PDF mit Linkoptionen extrahiert

Dieses Codebeispiel zeigt, wie man alle Hyperlinks aus einer PDF-Datei unter Verwendung benutzerdefinierter Optionen extrahiert.

C#

//  Initialisieren Sie die Parser mit dem PDF-Dokument
using (Parser parser = new Parser("input.docx"))
{
    // Überprüfen Sie, ob die Hyperlink-Extraktion unterstützt wird
    if (!parser.Features.Hyperlinks)
    {
        return;
    }

    // Link-Extraktionsoptionen festlegen, um Ergebnisse einzugrenzen
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // Hyperlinkdaten aus dem Dokument extrahieren
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(options);

    // Die Liste der extrahierten Links verarbeiten
    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}

Über die GroupDocs.Parser for .NET API

GroupDocs.Parser ist eine vielseitige API zum Parsen von Dokumenten für .NET-Entwickler. Sie unterstützt die Extraktion von Hyperlinks, Texten, Bildern und strukturierten Inhalten aus verschiedenen Dateiformaten wie PDF, Word, Excel, HTML und mehr — ohne auf externe Software angewiesen zu sein.
Mehr erfahren
About illustration

Bereit, loszulegen?

Laden Sie GroupDocs.Parser kostenlos herunter oder holen Sie sich eine Testlizenz für vollen Zugriff!

Nützliche Ressourcen

Erforschen Sie die Dokumentation, Code -Beispiele und die Unterstützung der Community, um Ihre Erfahrungen zu verbessern.

Unterstützte Formate für die Hyperlink-Extraktion

GroupDocs.Parser kann Hyperlinks aus einer Vielzahl von Dokumenttypen extrahieren. Unten sehen Sie die häufig unterstützten Formate.

Tipps zur temporären Lizenz

1
Melden Sie sich mit Ihrer geschäftlichen E-Mail-Adresse an. Kostenlose E-Mail-Dienste sind nicht zulässig.
2
Klicken Sie im zweiten Schritt auf die Schaltfläche Provisorische Lizenz anfordern.
 Deutsch