Extraiga hipervínculos de documentos, páginas o áreas de páginas específicas a través de la API de C#/VB.NET

GroupDocs.Parser .NET La API permite a los desarrolladores de software analizar y extraer hipervínculos de documentos, páginas o áreas de página de PDF, DOC, DOCX, PPT, PPTX, EML, MSG , XLS, XLSX, CSV, ODT, RTF, EPUB y muchos otros documentos.


Descargue prueba gratis

¿Cómo analizar y extraer hipervínculos de documentos OTP a través de la API .NET?

Un hipervínculo es un fragmento de texto, una imagen o un icono que apunta a un documento completo o a una parte particular dentro de un documento. El uso de hipervínculos permite a los usuarios navegar a una página web o documento. A menudo se requiere extraer hipervínculos de un documento y usarlo para acceder a documentos externos o páginas web. GroupDocs.Parser for .NET es una fascinante API de extracción de texto de documentos que proporciona una funcionalidad completa para implementar soluciones de extracción de texto y metadatos. Admite la extracción de texto e hipervínculos de PDF, correos electrónicos, libros electrónicos, Microsoft Office formatos: Word (DOC, DOCX), PowerPoint (PPT, PPTX), Excel ( XLS, XLSX), formatos de LibreOffice y muchos más. Admite varias funciones avanzadas para el análisis de documentos, la extracción de texto sin formato y estructurado, la búsqueda de texto por palabras clave, la extracción de metadatos o imágenes, los contenedores y los archivos adjuntos, y mucho más.

Extraer hipervínculos de OTP en .NET

GroupDocs.Parser for .NET facilita a los desarrolladores de C# extraer hipervínculos de un archivo OTP mediante la implementación de unos sencillos pasos.

  • Crear una instancia del objeto Parser para el documento inicial;
  • Compruebe si el documento admite la extracción de hipervínculos;
  • Llame al método GetHyperlinks y obtenga la colección de PageHyperlinkArea objetos;
  • Recorra la colección y obtenga un texto de hipervínculo y una URL.

Cómo extraer hipervínculos del archivo OTP usando el código de ejemplo C#

// Extraiga hipervínculos del archivo OTP usando la API GroupDocs.Parser
// Crear una instancia de la clase Parser
using (Parser parser = new Parser(filePath)) {
    // Compruebe si el documento admite la extracción de hipervínculos
    if (!parser.Features.Hyperlinks) {
        Console.WriteLine("El documento no admite la extracción de hipervínculos.");
        return;
    }
    // Extraer hipervínculos del documento
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();
    // Iterar sobre hipervínculos
    foreach (PageHyperlinkArea h in hyperlinks) {
        // Imprimir el texto del hipervínculo
        Console.WriteLine(h.Text);
        // Imprima la URL del hipervínculo
        Console.WriteLine(h.Url);
        Console.WriteLine();
    }
}

Requisitos del sistema

GroupDocs.Parser for .NET Las API son compatibles con todas las principales plataformas y sistemas operativos. Antes de ejecutar el código a continuación, asegúrese de tener instalados los siguientes requisitos previos en su sistema.

  • Sistemas operativos: Microsoft Windows, Linux, MacOS
  • Entornos de desarrollo: Microsoft Visual Studio, Xamarin, MonoDevelop
  • Marcos
  • Descarga la última versión de GroupDocs.Parser for .NET desde Nuget

Por qué usar GroupDocs.Parser for .NET

  • Compatibilidad con la extracción de texto sin formato de cualquier documento compatible
  • Análisis de documentos a través de plantillas definidas por el usuario
  • Totalmente compatible con la extracción de texto estructurado
  • Búsqueda de texto por palabra clave y expresión regular
  • Extraiga texto formateado, metadatos, imágenes, contenedores y archivos adjuntos
  • Extraiga la tabla de contenido para algunos formatos de documentos compatibles
  • Analizar datos de formulario de PDF documentos
  • Extraer hipervínculos del documento

Extraer hipervínculos de otros formatos de documentos

.NET API de extracción de hipervínculos y análisis de documentos para formatos de archivo e imágenes. Extraiga datos para algunos de los formatos de archivo populares como se indica a continuación.

PDF

(Portable Document Format)

PPS

(PowerPoint Slide Show)

PPSX

(PowerPoint Slide Show)

PPT

(Microsoft PowerPoint 97-2003)

PPTX

(Open XML presentation Format)

RTF

(Rich Text Format)

TEX

(LaTeX Source Document)

VDX

(The 7th Guest Video File)

VSDM

(Visio Macro-Enabled Drawing)

VSDX

(Visio Drawing)

VSSM

(Visio Macro-Enabled Stencil File)

VSSX

(Visio Stencil File)

VSTM

(Visio Macro-Enabled Drawing Template)

VSTX

(Visio Drawing Template)

VSX

(Visio Stencil XML File)

VTX

(Anim8or 3D Model)

Back to top
 Español