GroupDocs.Parser for .NET

Extraer hipervínculos de DOCX utilizando C#

Detecta y extrae URLs e hipervínculos de PDF, Word, Excel y otros tipos de documentos utilizando GroupDocs.Parser en tus aplicaciones .NET.

Descargar NuGet

Iniciar prueba gratuita

Pasos para extraer hipervínculos de Docx en C#

GroupDocs.Parser permite a los desarrolladores de .NET extraer hipervínculos de archivos DOCX siguiendo estos simples pasos:

Carga el archivo DOCX utilizando una instancia de Parser.
Verifica si el documento soporta la extracción de hipervínculos.
Recupera la lista de hipervínculos del documento.
Recorre los resultados y trabaja con las URLs extraídas.

Copiar

// Carga el documento que contiene hipervínculos utilizando la clase Parser
using (Parser parser = new Parser("input.docx")) {

    // Verifica que el archivo soporte extracción de hipervínculos
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("La extracción de hipervínculos no está disponible para el archivo");
        return;
    }

    // Recupera y procesa los hipervínculos extraídos
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();

    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}

dotnet add package GroupDocs.Parser

haga clic para copiar

copiado

Más ejemplos Documentación

Capacidades avanzadas de análisis de documentos

Además de la extracción de hipervínculos, GroupDocs.Parser te permite extraer texto, metadatos, imágenes y datos estructurados, apoyando flujos de trabajo de procesamiento de datos potentes.

Detección de hipervínculos y análisis de documentos

Detección de hipervínculos de documentos

Extrae rápidamente URLs y anotaciones de enlace de documentos como PDFs, archivos de Word, hojas de cálculo y más.

Soporte para enlaces web y embebidos

Detecta y extrae tanto URLs web estándar como enlaces embebidos en múltiples formatos.

Opciones de análisis flexibles

Personaliza las configuraciones de extracción para escanear secciones o páginas específicas para mejorar el rendimiento y la precisión.

Cómo extraer hipervínculos de un PDF utilizando opciones de enlace

Este ejemplo de código muestra cómo extraer todos los hipervínculos de un archivo PDF utilizando opciones personalizadas.

C#

//  Inicializa el Parser con el documento PDF
using (Parser parser = new Parser("input.docx"))
{
    // Verifica si se soporta la extracción de hipervínculos
    if (!parser.Features.Hyperlinks)
    {
        return;
    }

    // Establece opciones de extracción de enlaces para restringir resultados
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // Extrae datos de hipervínculos del documento
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(options);

    // Gestiona la lista de enlaces extraídos
    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}

Acerca de la API GroupDocs.Parser for .NET

GroupDocs.Parser es una API versátil de análisis de documentos para desarrolladores de .NET. Permite extraer hipervínculos, texto, imágenes y contenido estructurado de diversos formatos de archivo como PDF, Word, Excel, HTML y más, sin depender de software externo.

Aprender más

¿Listo para empezar?

Descargue GroupDocs.Parser gratis u obtenga una licencia de prueba para obtener acceso completo.

Descargar NuGet

Iniciar prueba gratuita

Recursos útiles

Explore la documentación, las muestras de código y el apoyo de la comunidad para mejorar su experiencia.

Formatos compatibles para extracción de hipervínculos

GroupDocs.Parser puede extraer hipervínculos de una amplia variedad de tipos de documentos. Consulta a continuación los formatos comúnmente compatibles.

Analizar PDF
(Formato de documento portátil)
Analizar PPTX
(Formato de presentación Open XML)
Analizar XLSX
(Libro de trabajo Open XML)
Analizar TXT
(Archivo de texto)
Analizar RTF
(Formato de texto enriquecido)
Analizar XML
(Lenguaje de marcado extensible)
Analizar EPUB
(Archivo de eBook abierto)