.API de clasificación de documentos y texto NET

Potencie sus aplicaciones .NET con capacidades de Clasificador de archivos y texto mediante etiquetas o categorías predefinidas dentro de las taxonomías IAB-2, Documentos y Sentimientos..


Descargue prueba gratis

El análisis de sentimientos de texto y la clasificación de texto son dos tecnologías poderosas que se pueden usar para extraer información significativa de datos textuales no estructurados y tienen numerosas aplicaciones prácticas en varias industrias. Estas técnicas se pueden aplicar en una amplia gama de casos de uso, desde el monitoreo de redes sociales hasta el análisis de comentarios de los clientes, la categorización de artículos de noticias, la detección de correos electrónicos no deseados y mucho más.

El análisis de sentimientos es el proceso de identificar el tono emocional de un texto. El objetivo del análisis de sentimientos es extraer información subjetiva del texto para comprender la opinión o el estado emocional del autor. Esta tecnología se puede aplicar al monitoreo de redes sociales, análisis de comentarios de clientes, gestión de reputación de marca y mucho más para clasificar comentarios o menciones en categorías positivas, negativas o neutrales.

La clasificación de texto es el proceso de clasificar el texto en clases o categorías predefinidas. Esta tecnología se puede utilizar para organizar grandes colecciones de documentos de texto o para filtrar información irrelevante de un flujo de datos de texto. La clasificación del texto puede basarse en diferentes criterios, como la semántica, el sentimiento o las categorías IAB (Interactive Advertising Bureau). La clasificación basada en IAB se utiliza para categorizar el texto según las categorías de IAB. Este enfoque se usa a menudo en publicidad para clasificar el contenido para la orientación de anuncios. Por ejemplo, un desarrollador de software puede usar la clasificación basada en IAB para clasificar el contenido del sitio web en diferentes categorías, como arte y entretenimiento, salud y estado físico o viajes.

La categorización de documentos es un caso de uso común para la clasificación de texto que implica organizar documentos en diferentes categorías según su contenido. Esto puede ser útil en varios sectores, como el legal, el financiero y el sanitario, donde hay una gran cantidad de datos no estructurados que deben organizarse y analizarse. Una forma de implementar la categorización de documentos es usar GroupDocs.Classification, una poderosa biblioteca de clasificación de texto que admite una amplia gama de formatos de documentos, incluidos PDF, DOC, DOCX, RTF y TXT. Nuestra solución se basa en algoritmos de aprendizaje automático que la hacen altamente precisa y confiable, lo que le permite tomar decisiones más inteligentes basadas en sus datos de texto. Como desarrollador de software, puede utilizar el análisis de opiniones de texto y la clasificación de textos para crear una amplia gama de aplicaciones, como una herramienta de seguimiento de redes sociales que realiza un seguimiento de las menciones de marca y las clasifica por opinión, un agregador de noticias que clasifica los artículos por tema, un filtro de correo no deseado que utiliza la clasificación de texto para identificar y filtrar correos electrónicos no deseados o extraer otros conocimientos significativos de datos textuales no estructurados y crear aplicaciones que brindan valor a los usuarios.

Una de las mejores características de GroupDocs.Classification es su flexibilidad. Esto significa que puede clasificar texto con casi cualquier tipo de documento. Otra gran característica de GroupDocs.Classification es su API fácil de usar. Con solo unas pocas líneas de código, puede integrar nuestra biblioteca en su propia aplicación y comenzar a clasificar el texto de inmediato. Nuestra API es fácil de usar y está bien documentada, por lo que puede empezar a trabajar en poco tiempo. Al usar GroupDocs.Classification para la categorización de documentos, las empresas pueden ahorrar tiempo y recursos al automatizar el proceso de organización y análisis de sus documentos. Esto puede conducir a flujos de trabajo más eficientes, una mejor toma de decisiones y, en última instancia, mejores resultados comerciales.

Características avanzadas de la API de clasificación de documentos y texto

Clasificación precisa de documentos

GroupDocs.Classification API admite la clasificación para una variedad de formatos de documentos. El siguiente ejemplo de código C# muestra cómo clasificar un archivo PDF de la carpeta actual con la taxonomía de Documentos al obtener los 3 mejores resultados.

// Inicializa el clasificador de propósito general (IAB-2, Documentos, Análisis de sentimiento).
var classifier = new GroupDocs.Classification.Classifier();

// Clasifique el archivo pdf con la taxonomía de Documentos y devuelva las 3 categorías más probables.
var response = classifier.Classify("document.pdf", ".", 3, Taxonomy.Documents);
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

Precise Text Classification

La API GroupDocs.Classification también admite la clasificación de texto. La clasificación de texto se puede realizar con 4 taxonomías diferentes: IAB-2, Documents, Sentiment y Sentiment3. El siguiente ejemplo de código C# muestra cómo clasificar el texto con la taxonomía predeterminada (IAB-2) devolviendo el mejor resultado.

// Inicializa el clasificador de propósito general (IAB-2, Documentos, Análisis de sentimiento).
var classifier = new GroupDocs.Classification.Classifier();

// Clasifica el texto con la taxonomía IAB-2 y devuelve la mejor categoría.
var response = classifier.Classify("Classify text using the default IAB-2 taxonomy");
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

Precise Multilingual Sentiment Analysis

GroupDocs.Classification para .NET permite realizar análisis de opinión (clasificación) entre dominios en inglés, chino, español y alemán. GroupDocs.Classification para .NET detectará automáticamente los idiomas adecuados. Los casos de uso de la API de análisis de sentimientos se ilustran con el siguiente código C#:

// Inicializa el clasificador de opiniones multilingüe entre dominios.
// SentimentClassifier admite la clasificación multilingüe con inglés, chino, español y alemán.
var classifier = new GroupDocs.Classification.SentimentClassifier();

// Análisis de sentimiento del texto en inglés.
var response = classifier.Classify("Experience is simply the name we give our mistakes");
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

// Análisis de sentimiento del texto chino con el mismo clasificador y taxonomía Sentimiento3 (Negativo/Neutro/Positivo).
response = classifier.Classify("熟能生巧", taxonomy: Taxonomy.Sentiment3);
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

Recursos de apoyo y aprendizaje

Back to top
 Español