GroupDocs.Parser for .NET

Extraer texto de RTF usando C#

Extrae rápidamente texto legible y estructurado de PDFs, Word, Excel y otros tipos de archivos utilizando GroupDocs.Parser en tus soluciones .NET.

Pasos para extraer texto de Rtf en C#

Puedes extraer texto limpio y estructurado de documentos RTF en aplicaciones .NET con GroupDocs.Parser siguiendo estos pasos:

  1. Abre el documento RTF utilizando una instancia de Parser.
  2. Extrae el texto del contenido del archivo.
  3. Verifica el resultado para confirmar que la extracción de texto fue exitosa.
  4. Utiliza el texto extraído en tu lógica empresarial, indexación o tuberías de datos.
// Carga tu documento en Parser
using (Parser parser = new Parser("input.rtf")) {

    // Extrae todo el contenido de texto del archivo
    using (TextReader reader = parser.GetText()) 
    {
        // Si el texto no está disponible, el resultado será nulo
        // Utiliza el texto extraído en tu aplicación
        Console.WriteLine(reader == null ? 
            "La extracción de texto no es compatible con este formato" : reader.ReadToEnd());
    }
}
dotnet add package GroupDocs.Parser
haga clic para copiar
copiado
Más ejemplos Documentación

Características integrales de extracción de contenido

Además del texto plano, GroupDocs.Parser puede extraer imágenes, elementos estructurados y metadatos para apoyar el análisis, transformación y automatización de contenido.

Reconocimiento de texto y análisis de documentos estructurados

Extracción de texto en varios tipos de archivos

Obtén texto plano o estructurado de formatos como PDF, DOCX, XLSX, PPTX, HTML y otros formatos.

Proceso de texto de documentos y visuales

Extrae texto de imágenes escaneadas, presentaciones, hojas de cálculo y documentos digitales mientras preservas la estructura.

Configuración avanzada de extracción de texto

Personaliza cómo se detecta el texto: define rangos de páginas, regiones de diseño y ajusta la salida para una precisión máxima.

Cómo extraer áreas de texto de un archivo PPTX

Este ejemplo de código muestra cómo recuperar el contenido de texto junto con las coordenadas de área de un archivo de PowerPoint utilizando GroupDocs.Parser.

C#

//  Cargar la presentación de PowerPoint con Parser
using (Parser parser = new Parser("input.pptx"))
{
    // Extraer todos los rectángulos de áreas de texto del documento
    IEnumerable<PageTextArea> areas = parser.GetTextAreas();

    // Salir si la extracción de áreas de texto no está disponible
    if (areas == null)
    {
        return;
    }

    // Iterar a través de las áreas de texto de cada página
    foreach (PageTextArea a in areas)
    {
        // Acceder al índice de la página, rectángulo de área y valor de texto
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
    }
}

Acerca de la API GroupDocs.Parser for .NET

GroupDocs.Parser es una API de análisis de documentos de alto rendimiento para desarrolladores de .NET. Simplifica la extracción de texto, imágenes, tablas y contenido estructurado de múltiples formatos de archivo, incluyendo PDF, DOCX, XLSX, PPTX y más, sin depender de bibliotecas de terceros.
Aprender más
About illustration

¿Listo para empezar?

Descargue GroupDocs.Parser gratis u obtenga una licencia de prueba para obtener acceso completo.

Recursos útiles

Explore la documentación, las muestras de código y el apoyo de la comunidad para mejorar su experiencia.

Formatos compatibles para extracción de texto

GroupDocs.Parser permite la extracción de texto de una amplia variedad de tipos de documentos e imágenes. Explora los formatos comúnmente soportados que se enumeran a continuación.

Consejos para licencias temporales

1
Regístrate con tu correo electrónico del trabajo. No se permiten servicios de correo gratuitos.
2
Utilice el botón Obtener una licencia temporal en el segundo paso.
 Español