.NET 文本和文档分类 API

使用 IAB-2、文档和情感分类法中的预定义标签或类别,为您的 .NET 应用程序提供文件和文本分类器功能.


下载免费试用版

文本情感分析和文本分类是两种强大的技术,可用于从非结构化文本数据中提取有意义的见解,并在各行各业都有大量实际应用。 这些技术可应用于广泛的用例,从社交媒体监控到客户反馈分析,再到新闻文章分类,再到检测垃圾邮件等等。

情感分析是识别一段文本的情感基调的过程。 情感分析的目标是从文本中提取主观信息,以了解作者的观点或情绪状态。 该技术可应用于社交媒体监控、客户反馈分析、品牌声誉管理等,以将反馈或提及分为正面、负面或中性类别。

文本分类是将文本分类为预定义类或类别的过程。 该技术可用于组织大量文本文档或从文本数据流中过滤掉不相关的信息。 文本分类可以基于不同的标准,例如语义、情感或 IAB(互动广告局)类别。 基于 IAB 的分类用于根据 IAB 类别对文本进行分类。 这种方法通常用于广告中,以对内容进行分类以进行广告定位。 例如,软件开发人员可以使用基于 IAB 的分类将网站内容分类为不同的类别,例如艺术和娱乐、健康和健身或旅游。

文档分类是文本分类的一个常见用例,它涉及根据文档的内容将文档组织成不同的类别。 这在法律、金融和医疗保健等各种行业中非常有用,在这些行业中需要组织和分析大量非结构化数据。 实现文档分类的一种方法是使用 GroupDocs.Classification,这是一个功能强大的文本分类库,支持多种文档格式,包括 PDF、DOC、DOCX、RTF 和 TXT。 我们的解决方案建立在机器学习算法之上,使其高度准确可靠,使您能够根据文本数据做出更明智的决策。 作为软件开发人员,您可以使用文本情感分析和文本分类来创建范围广泛的应用程序,例如跟踪品牌提及并按情感对其进行分类的社交媒体监控工具、按主题对文章进行分类的新闻聚合器、垃圾邮件过滤器 使用文本分类来识别和过滤垃圾邮件或从非结构化文本数据中提取其他有意义的见解,并构建为用户提供价值的应用程序。

GroupDocs.Classification 的最佳功能之一是它的灵活性。 这意味着您可以使用几乎任何类型的文档对文本进行分类。 GroupDocs.Classification 的另一个重要特性是其用户友好的 API。 只需几行代码,您就可以将我们的库集成到您自己的应用程序中,并立即开始对文本进行分类。 我们的 API 易于使用且文档齐全,因此您可以立即启动并运行。 通过使用 GroupDocs.Classification 进行文档分类,企业可以通过自动化组织和分析文档的过程来节省时间和资源。 这可以带来更高效的工作流程、更好的决策制定,并最终改善业务成果。

高级文本和文档分类 API 功能

精确的文件分类

GroupDocs.Classification API 支持多种文档格式的分类。下面的 C# 代码示例显示了如何通过返回 3 个最佳结果来使用 Documents 分类对当前文件夹中的 PDF 文件进行分类。

// 初始化通用分类器(IAB-2、文档、情感分析
var classifier = new GroupDocs.Classification.Classifier();

// 使用 Documents taxonomy 对 pdf 文件进行分类并返回 3 个最可能的类别
var response = classifier.Classify("document.pdf", ".", 3, Taxonomy.Documents);
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

精确的文本分类

GroupDocs.Classification API 也支持文本分类。可以使用 4 种不同的分类法执行文本分类:IAB-2、Documents、Sentiment 和 Sentiment3。下面的 C# 代码示例显示了如何通过返回最佳结果来使用默认 (IAB-2) 分类法对文本进行分类。

// 初始化通用分类器(IAB-2、文档、情感分析)
var classifier = new GroupDocs.Classification.Classifier();

// 使用 IAB-2 分类法对文本进行分类并返回最佳类别
var response = classifier.Classify("Classify text using the default IAB-2 taxonomy");
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

精确的多语言情感分析

GroupDocs.Classification for .NET 允许以英语、中文、西班牙语和德语执行跨域情感分析(分类)。 GroupDocs.Classification for .NET 将自动检测正确的语言。以下 C# 代码说明了情感分析 API 用例:

// 初始化跨域多语言情感分类器
// SentimentClassifier 支持英语、汉语、西班牙语和德语的多语言分类
var classifier = new GroupDocs.Classification.SentimentClassifier();

// 英文文本的情感分析
var response = classifier.Classify("Experience is simply the name we give our mistakes");
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

// 具有相同分类器和 Sentiment3 (Negative / Neutral / Positive) 分类法的中文文本的情感分析
response = classifier.Classify("熟能生巧", taxonomy: Taxonomy.Sentiment3);
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

支持和学习资源

Back to top
 中国人