GroupDocs.Parser for .NET

Extraer hipervínculos de DOCX utilizando C#

Detecta y extrae URLs e hipervínculos de PDF, Word, Excel y otros tipos de documentos utilizando GroupDocs.Parser en tus aplicaciones .NET.

Pasos para extraer hipervínculos de Docx en C#

GroupDocs.Parser permite a los desarrolladores de .NET extraer hipervínculos de archivos DOCX siguiendo estos simples pasos:

  1. Carga el archivo DOCX utilizando una instancia de Parser.
  2. Verifica si el documento soporta la extracción de hipervínculos.
  3. Recupera la lista de hipervínculos del documento.
  4. Recorre los resultados y trabaja con las URLs extraídas.
// Carga el documento que contiene hipervínculos utilizando la clase Parser
using (Parser parser = new Parser("input.docx")) {

    // Verifica que el archivo soporte extracción de hipervínculos
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("La extracción de hipervínculos no está disponible para el archivo");
        return;
    }

    // Recupera y procesa los hipervínculos extraídos
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();

    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}
dotnet add package GroupDocs.Parser
haga clic para copiar
copiado
Más ejemplos Documentación

Capacidades avanzadas de análisis de documentos

Además de la extracción de hipervínculos, GroupDocs.Parser te permite extraer texto, metadatos, imágenes y datos estructurados, apoyando flujos de trabajo de procesamiento de datos potentes.

Detección de hipervínculos y análisis de documentos

Detección de hipervínculos de documentos

Extrae rápidamente URLs y anotaciones de enlace de documentos como PDFs, archivos de Word, hojas de cálculo y más.

Soporte para enlaces web y embebidos

Detecta y extrae tanto URLs web estándar como enlaces embebidos en múltiples formatos.

Opciones de análisis flexibles

Personaliza las configuraciones de extracción para escanear secciones o páginas específicas para mejorar el rendimiento y la precisión.

Cómo extraer hipervínculos de un PDF utilizando opciones de enlace

Este ejemplo de código muestra cómo extraer todos los hipervínculos de un archivo PDF utilizando opciones personalizadas.

C#

//  Inicializa el Parser con el documento PDF
using (Parser parser = new Parser("input.docx"))
{
    // Verifica si se soporta la extracción de hipervínculos
    if (!parser.Features.Hyperlinks)
    {
        return;
    }

    // Establece opciones de extracción de enlaces para restringir resultados
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // Extrae datos de hipervínculos del documento
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(options);

    // Gestiona la lista de enlaces extraídos
    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}

Acerca de la API GroupDocs.Parser for .NET

GroupDocs.Parser es una API versátil de análisis de documentos para desarrolladores de .NET. Permite extraer hipervínculos, texto, imágenes y contenido estructurado de diversos formatos de archivo como PDF, Word, Excel, HTML y más, sin depender de software externo.
Aprender más
About illustration

¿Listo para empezar?

Descargue GroupDocs.Parser gratis u obtenga una licencia de prueba para obtener acceso completo.

Recursos útiles

Explore la documentación, las muestras de código y el apoyo de la comunidad para mejorar su experiencia.

Formatos compatibles para extracción de hipervínculos

GroupDocs.Parser puede extraer hipervínculos de una amplia variedad de tipos de documentos. Consulta a continuación los formatos comúnmente compatibles.

Consejos para licencias temporales

1
Regístrate con tu correo electrónico del trabajo. No se permiten servicios de correo gratuitos.
2
Utilice el botón Obtener una licencia temporal en el segundo paso.
 Español