テキスト感情分析とテキスト分類は、非構造化テキスト データから有意義な洞察を抽出するために使用できる 2 つの強力なテクノロジであり、さまざまな業界で数多くの実用的な用途があります。 これらの技術は、ソーシャル メディアの監視から顧客フィードバック分析、ニュース記事の分類、スパム メールの検出など、幅広いユースケースに適用できます。
感情分析は、テキストの感情的な調子を特定するプロセスです。 感情分析の目的は、テキストから主観的な情報を抽出して、作成者の意見や感情状態を理解することです。 このテクノロジーは、ソーシャル メディアのモニタリング、顧客フィードバック分析、ブランド評判管理などに適用して、フィードバックやメンションを肯定的、否定的、または中立的なカテゴリに分類できます。
テキスト分類は、テキストを事前定義されたクラスまたはカテゴリに分類するプロセスです。 このテクノロジーを使用すると、テキスト ドキュメントの大規模なコレクションを整理したり、テキスト データのストリームから無関係な情報をフィルタリングしたりすることができます。 テキストの分類は、セマンティクス、感情、IAB (Interactive Advertising Bureau) カテゴリなど、さまざまな基準に基づいて行うことができます。 IAB ベースの分類は、IAB カテゴリに基づいてテキストを分類するために使用されます。 このアプローチは、広告のターゲット設定のためにコンテンツを分類するために広告でよく使用されます。 たとえば、ソフトウェア開発者は、IAB ベースの分類を使用して、Web サイトのコンテンツを芸術とエンターテイメント、健康とフィットネス、旅行などのさまざまなカテゴリに分類できます。
ドキュメントの分類は、コンテンツに基づいてドキュメントをさまざまなカテゴリに整理するテキスト分類の一般的な使用例です。 これは、整理して分析する必要がある大量の非構造化データが存在する、法律、金融、医療などのさまざまな業界で役立ちます。 ドキュメントの分類を実装する 1 つの方法は、PDF、DOC、DOCX、RTF、TXT などの幅広いドキュメント形式をサポートする強力なテキスト分類ライブラリである GroupDocs.Classification を使用することです。 当社のソリューションは機械学習アルゴリズムに基づいて構築されているため、精度と信頼性が高く、テキスト データに基づいてより賢明な意思決定を行うことができます。 ソフトウェア開発者は、テキスト感情分析とテキスト分類を使用して、ブランドへの言及を追跡し感情別に分類するソーシャル メディア監視ツール、記事をトピック別に分類するニュース アグリゲーター、スパムメール フィルターなどの幅広いアプリケーションを作成できます。 テキスト分類を使用してスパムメールを識別して除外したり、非構造化テキストデータからその他の有意義な洞察を抽出したり、ユーザーに価値を提供するアプリケーションを構築したりできます。
GroupDocs.Classification の最も優れた機能の 1 つは、その柔軟性です。 これは、ほぼすべての種類のドキュメントのテキストを分類できることを意味します。 GroupDocs.Classification のもう 1 つの優れた機能は、ユーザー フレンドリーな API です。 わずか数行のコードを記述するだけで、ライブラリを独自のアプリケーションに統合し、テキストの分類をすぐに開始できます。 当社の API は使いやすく、十分に文書化されているため、すぐに使い始めて実行できます。 GroupDocs.Classification をドキュメントの分類に使用することで、企業はドキュメントの整理と分析のプロセスを自動化し、時間とリソースを節約できます。 これにより、ワークフローの効率化、意思決定の向上、そして最終的にはビジネスの成果の向上につながる可能性があります。
GroupDocs.Classification APIは、さまざまなドキュメント形式の分類をサポートしています。以下のC#コード例は、3つの最良の結果を返すことにより、ドキュメント分類法を使用して現在のフォルダーからPDFファイルを分類する方法を示しています。
//汎用分類子(IAB-2、ドキュメント、感情分析)を初期化します。
var classifier = new GroupDocs.Classification.Classifier();
// PDFファイルをドキュメント分類で分類し、最も可能性の高い3つのカテゴリを返します。
var response = classifier.Classify("document.pdf", ".", 3, Taxonomy.Documents);
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");
GroupDocs.Classification APIは、テキスト分類もサポートしています。テキスト分類は、IAB-2、Documents、Sentiment、およびSentiment3の4つの異なる分類で実行できます。以下のC#コード例は、最良の結果を返すことにより、デフォルト(IAB-2)の分類法でテキストを分類する方法を示しています。
//汎用分類子(IAB-2、ドキュメント、感情分析)を初期化します。
var classifier = new GroupDocs.Classification.Classifier();
// IAB-2分類法を使用してテキストを分類し、最適なカテゴリを返します。
var response = classifier.Classify("Classify text using the default IAB-2 taxonomy");
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");
GroupDocs.Classification for .NETを使用すると、英語、中国語、スペイン語、およびドイツ語でクロスドメイン感情分析(分類)を実行できます。 GroupDocs.Classification for .NETは、適切な言語を自動的に検出します。感情分析APIのユースケースは、次のC#コードで示されています。
//クロスドメイン多言語感情分類子を初期化します。
// SentimentClassifierは、英語、中国語、スペイン語、ドイツ語の多言語分類をサポートしています。
var classifier = new GroupDocs.Classification.SentimentClassifier();
//英語のテキストの感情分析。
var response = classifier.Classify("Experience is simply the name we give our mistakes");
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");
//同じ分類子とSentiment3(Negative / Neutral / Positive)分類法を使用した中国語テキストの感情分析。
response = classifier.Classify("熟能生巧", taxonomy: Taxonomy.Sentiment3);
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");