Un hipervínculo es un fragmento de texto, una imagen o un icono que apunta a un documento completo o a una parte particular dentro de un documento. El uso de hipervínculos permite a los usuarios navegar a una página web o documento. A menudo se requiere extraer hipervínculos de un documento y usarlo para acceder a documentos externos o páginas web. GroupDocs.Parser for .NET es una fascinante API de extracción de texto de documentos que proporciona una funcionalidad completa para implementar soluciones de extracción de texto y metadatos. Admite la extracción de texto e hipervínculos de PDF, correos electrónicos, libros electrónicos, Microsoft Office formatos: Word (DOC, DOCX), PowerPoint (PPT, PPTX), Excel ( XLS, XLSX), formatos de LibreOffice y muchos más. Admite varias funciones avanzadas para el análisis de documentos, la extracción de texto sin formato y estructurado, la búsqueda de texto por palabras clave, la extracción de metadatos o imágenes, los contenedores y los archivos adjuntos, y mucho más.
GroupDocs.Parser for .NET facilita a los desarrolladores de C# extraer hipervínculos de un archivo OTP mediante la implementación de unos sencillos pasos.
// Extraiga hipervínculos del archivo OTP usando la API GroupDocs.Parser
// Crear una instancia de la clase Parser
using (Parser parser = new Parser(filePath)) {
// Compruebe si el documento admite la extracción de hipervínculos
if (!parser.Features.Hyperlinks) {
Console.WriteLine("El documento no admite la extracción de hipervínculos.");
return;
}
// Extraer hipervínculos del documento
IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();
// Iterar sobre hipervínculos
foreach (PageHyperlinkArea h in hyperlinks) {
// Imprimir el texto del hipervínculo
Console.WriteLine(h.Text);
// Imprima la URL del hipervínculo
Console.WriteLine(h.Url);
Console.WriteLine();
}
}
GroupDocs.Parser for .NET Las API son compatibles con todas las principales plataformas y sistemas operativos. Antes de ejecutar el código a continuación, asegúrese de tener instalados los siguientes requisitos previos en su sistema.
.NET API de extracción de hipervínculos y análisis de documentos para formatos de archivo e imágenes. Extraiga datos para algunos de los formatos de archivo populares como se indica a continuación.
(Portable Document Format)
(PowerPoint Slide Show)
(PowerPoint Slide Show)
(Microsoft PowerPoint 97-2003)
(Open XML presentation Format)
(Rich Text Format)
(LaTeX Source Document)
(The 7th Guest Video File)
(Visio Macro-Enabled Drawing)
(Visio Drawing)
(Visio Macro-Enabled Stencil File)
(Visio Stencil File)
(Visio Macro-Enabled Drawing Template)
(Visio Drawing Template)
(Visio Stencil XML File)
(Anim8or 3D Model)