Extrahieren Sie Hyperlinks aus Dokumenten, Seiten oder bestimmten Seitenbereichen über die C#/VB-API

GroupDocs.Parser .NET API ermöglicht Softwareentwicklern das Parsen und Extrahieren von Hyperlinks aus Dokumenten, Seiten oder Seitenbereichen von PDF, DOC, DOCX, PPT, PPTX, EML, MSG , XLS, XLSX, CSV, ODT, RTF, EPUB und viele andere Dokumente.


Download kostenlose Testversion

Wie kann ich Hyperlinks aus OTP-Dokumenten über die .NET-API analysieren und extrahieren?

Ein Hyperlink ist ein Textstück, ein Bild oder ein Symbol, das auf ein gesamtes Dokument oder auf einen bestimmten Teil innerhalb eines Dokuments verweist. Durch die Verwendung von Hyperlinks können Benutzer zu einer Webseite oder einem Dokument navigieren. Oft ist es erforderlich, Hyperlinks aus einem Dokument zu extrahieren und diese für den Zugriff auf ein externes Dokument oder eine Webseite zu verwenden. GroupDocs.Parser for .NET ist eine faszinierende API zur Extraktion von Dokumententexten, die vollständige Funktionalität für die Implementierung von Text- und Metadatenextraktionslösungen bietet. Es unterstützt die Extraktion von Text und Hyperlinks aus den Formaten PDF, E-Mails, E-Books und Microsoft Office: Word (DOC, DOCX), PowerPoint (PPT, PPTX), Excel ( XLS, XLSX), LibreOffice-Formate und viele mehr. Es unterstützt mehrere erweiterte Funktionen zum Parsen von Dokumenten, zum Extrahieren von einfachem und strukturiertem Text, zur Textsuche nach Schlüsselwörtern, zum Extrahieren von Metadaten oder Bildern, Containern sowie Anhängen und vielem mehr.

Extrahieren Sie Hyperlinks von OTP in .NET

GroupDocs.Parser for .NET erleichtert C#-Entwicklern das Extrahieren von Hyperlinks aus einer OTP-Datei durch die Implementierung einiger einfacher Schritte.

  • Instanziieren Sie das Parser-Objekt für das ursprüngliche Dokument.
  • Überprüfen Sie, ob das Dokument die Hyperlink-Extraktion unterstützt.
  • Rufen Sie die Methode GetHyperlinks auf und erhalten Sie eine Sammlung von PageHyperlinkArea Objekte ab;
  • Durchlaufen Sie die Sammlung und erhalten Sie einen Hyperlinktext und eine URL.

So extrahieren Sie Hyperlinks aus der Datei OTP mithilfe des Beispielcodes C#

// Extrahieren Sie Hyperlinks aus der Datei OTP mit der API GroupDocs.Parser
// Erstellen Sie eine Instanz der Parser-Klasse
using (Parser parser = new Parser(filePath)) {
    // Überprüfen Sie, ob das Dokument die Hyperlink-Extraktion unterstützt
    if (!parser.Features.Hyperlinks) {
        Console.WriteLine("Das Dokument unterstützt die Hyperlink-Extraktion nicht.");
        return;
    }
    // Extrahieren Sie Hyperlinks aus dem Dokument
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();
    // Iterieren Sie über Hyperlinks
    foreach (PageHyperlinkArea h in hyperlinks) {
        // Drucken Sie den Hyperlinktext aus
        Console.WriteLine(h.Text);
        // Drucken Sie die Hyperlink-URL aus
        Console.WriteLine(h.Url);
        Console.WriteLine();
    }
}

System Anforderungen

GroupDocs.Parser for .NET APIs werden auf allen wichtigen Plattformen und Betriebssystemen unterstützt. Bevor Sie den folgenden Code ausführen, stellen Sie bitte sicher, dass die folgenden Voraussetzungen auf Ihrem System installiert sind.

  • Betriebssysteme: Microsoft Windows, Linux, MacOS
  • Entwicklungsumgebungen: Microsoft Visual Studio, Xamarin, MonoDevelop
  • Rahmenwerke
  • Laden Sie die neueste Version von GroupDocs.Parser for .NET von Nuget herunter.

Warum GroupDocs.Parser for .NET verwenden?

  • Unterstützung für die Extraktion von Klartext aus allen unterstützten Dokumenten
  • Parsen von Dokumenten über benutzerdefinierte Vorlagen
  • Vollständige Unterstützung der strukturierten Textextraktion
  • Textsuche über Schlüsselwörter sowie reguläre Ausdrücke
  • Extrahieren Sie formatierten Text, Metadaten, Bilder, Container und Anhänge
  • Extrahieren Sie das Inhaltsverzeichnis für einige unterstützte Dokumentformate
  • Analysieren Sie Formulardaten aus PDF-Dokumenten
  • Extrahieren Sie Hyperlinks aus dem Dokument

Extrahieren Sie Hyperlinks aus anderen Dokumentformaten

.NET API zum Parsen und Extrahieren von Hyperlinks für Dateiformate und Bilder. Extrahieren Sie Daten für einige der gängigen Dateiformate, wie unten aufgeführt.

PDF

(Portable Document Format)

PPS

(PowerPoint Slide Show)

PPSX

(PowerPoint Slide Show)

PPT

(Microsoft PowerPoint 97-2003)

PPTX

(Open XML presentation Format)

RTF

(Rich Text Format)

TEX

(LaTeX Source Document)

VDX

(The 7th Guest Video File)

VSDM

(Visio Macro-Enabled Drawing)

VSDX

(Visio Drawing)

VSSM

(Visio Macro-Enabled Stencil File)

VSSX

(Visio Stencil File)

VSTM

(Visio Macro-Enabled Drawing Template)

VSTX

(Visio Drawing Template)

VSX

(Visio Stencil XML File)

VTX

(Anim8or 3D Model)

Back to top
 Deutsch