.NET Text- und Dokumentenklassifizierungs-API

Stärken Sie Ihre .NET-Anwendungen mit Datei- und Textklassifikator-Fähigkeiten unter Verwendung vordefinierter Tags oder Kategorien innerhalb von IAB-2-, Dokumenten- und Sentiment-Taxonomien.


Download kostenlose Testversion

Text-Sentiment-Analyse und Textklassifizierung sind zwei leistungsstarke Technologien, mit denen aus unstrukturierten Textdaten aussagekräftige Erkenntnisse gewonnen werden können und die zahlreiche praktische Anwendungen in verschiedenen Branchen haben. Diese Techniken können in einer Vielzahl von Anwendungsfällen eingesetzt werden, von der Überwachung sozialer Medien über die Analyse von Kundenfeedback bis hin zur Kategorisierung von Nachrichtenartikeln, der Erkennung von Spam-E-Mails und vielem mehr.

Bei der Stimmungsanalyse geht es darum, den emotionalen Ton eines Textes zu ermitteln. Das Ziel der Stimmungsanalyse besteht darin, subjektive Informationen aus Texten zu extrahieren, um die Meinung oder den emotionalen Zustand des Autors zu verstehen. Diese Technologie kann auf die Überwachung sozialer Medien, die Analyse von Kundenfeedback, das Management der Markenreputation und vieles mehr angewendet werden, um Feedback oder Erwähnungen in positive, negative oder neutrale Kategorien zu klassifizieren.

Bei der Textklassifizierung handelt es sich um den Prozess der Kategorisierung von Text in vordefinierte Klassen oder Kategorien. Mit dieser Technologie können große Sammlungen von Textdokumenten organisiert oder irrelevante Informationen aus einem Textdatenstrom herausgefiltert werden. Die Textklassifizierung kann auf verschiedenen Kriterien basieren, beispielsweise auf Semantik, Stimmung oder IAB-Kategorien (Interactive Advertising Bureau). Die IAB-basierte Klassifizierung wird verwendet, um Text basierend auf den IAB-Kategorien zu kategorisieren. Dieser Ansatz wird in der Werbung häufig verwendet, um Inhalte für die Anzeigenausrichtung zu klassifizieren. Beispielsweise kann ein Softwareentwickler die IAB-basierte Klassifizierung verwenden, um Website-Inhalte in verschiedene Kategorien einzuteilen, beispielsweise Kunst und Unterhaltung, Gesundheit und Fitness oder Reisen.

Die Kategorisierung von Dokumenten ist ein häufiger Anwendungsfall für die Textklassifizierung, bei der Dokumente basierend auf ihrem Inhalt in verschiedene Kategorien eingeteilt werden. Dies kann in verschiedenen Branchen nützlich sein, beispielsweise im Rechts-, Finanz- und Gesundheitswesen, wo große Mengen unstrukturierter Daten organisiert und analysiert werden müssen. Eine Möglichkeit zur Implementierung der Dokumentkategorisierung ist die Verwendung von GroupDocs.Classification, einer leistungsstarken Textklassifizierungsbibliothek, die eine Vielzahl von Dokumentformaten unterstützt, darunter PDF, DOC, DOCX, RTF und TXT. Unsere Lösung basiert auf maschinellen Lernalgorithmen, die sie äußerst genau und zuverlässig machen und es Ihnen ermöglichen, auf der Grundlage Ihrer Textdaten intelligentere Entscheidungen zu treffen. Als Softwareentwickler können Sie Text-Sentiment-Analyse und Textklassifizierung verwenden, um eine Vielzahl von Anwendungen zu erstellen, z. B. ein Social-Media-Überwachungstool, das Markenerwähnungen verfolgt und sie nach Sentiment kategorisiert, einen Nachrichtenaggregator, der Artikel nach Themen kategorisiert, oder einen Spam-E-Mail-Filter das Textklassifizierung verwendet, um Spam-E-Mails zu identifizieren und herauszufiltern oder andere aussagekräftige Erkenntnisse aus unstrukturierten Textdaten zu extrahieren und Anwendungen zu erstellen, die Benutzern einen Mehrwert bieten.

Eine der besten Eigenschaften von GroupDocs.Classification ist seine Flexibilität. Das bedeutet, dass Sie Text mit fast jedem Dokumenttyp klassifizieren können. Ein weiteres großartiges Feature von GroupDocs.Classification ist seine benutzerfreundliche API. Mit nur wenigen Codezeilen können Sie unsere Bibliothek in Ihre eigene Anwendung integrieren und sofort mit der Textklassifizierung beginnen. Unsere API ist einfach zu verwenden und gut dokumentiert, sodass Sie im Handumdrehen loslegen können. Durch die Verwendung von GroupDocs.Classification zur Dokumentenkategorisierung können Unternehmen Zeit und Ressourcen sparen, indem sie den Prozess der Organisation und Analyse ihrer Dokumente automatisieren. Dies kann zu effizienteren Arbeitsabläufen, besserer Entscheidungsfindung und letztlich besseren Geschäftsergebnissen führen.

Erweiterte Funktionen der Text- und Dokumentenklassifizierungs-API

Präzise Dokumentenklassifizierung

GroupDocs.Classification API unterstützt die Klassifizierung für eine Vielzahl von Dokumentformaten. Das folgende C#-Codebeispiel zeigt, wie eine PDF-Datei aus dem aktuellen Ordner mit der Dokumententaxonomie klassifiziert wird, indem die drei besten Ergebnisse zurückgegeben werden.

// Universalklassifikator initialisieren (IAB-2, Dokumente, Stimmungsanalyse).
var classifier = new GroupDocs.Classification.Classifier();

// Klassifizieren Sie die PDF-Datei mit der Dokumententaxonomie und geben Sie die 3 wahrscheinlichsten Kategorien zurück.
var response = classifier.Classify("document.pdf", ".", 3, Taxonomy.Documents);
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

Precise Text Classification

GroupDocs.Classification API unterstützt auch die Textklassifizierung. Die Textklassifizierung kann mit 4 verschiedenen Taxonomien durchgeführt werden: IAB-2, Dokumente, Stimmung und Stimmung3. Das folgende C#-Codebeispiel zeigt, wie Text mit der Standardtaxonomie (IAB-2) klassifiziert wird, indem das beste Ergebnis zurückgegeben wird.

// Initialize general-purpose classifier (IAB-2, Documents, Sentiment Analysis).
var classifier = new GroupDocs.Classification.Classifier();

// Classify text with IAB-2 taxonomy and return the the best category.
var response = classifier.Classify("Classify text using the default IAB-2 taxonomy");
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

Precise Multilingual Sentiment Analysis

GroupDocs.Classification for .NET ermöglicht die domänenübergreifende Stimmungsanalyse (Klassifizierung) in Englisch, Chinesisch, Spanisch und Deutsch. GroupDocs.Classification for .NET erkennt die richtige(n) Sprache(n) automatisch. Anwendungsfälle der Stimmungsanalyse-API werden durch den folgenden C#-Code veranschaulicht:

// Domänenübergreifenden mehrsprachigen Sentiment-Klassifikator initialisieren.
// SentimentClassifier unterstützt die mehrsprachige Klassifizierung mit Englisch, Chinesisch, Spanisch und Deutsch.
var classifier = new GroupDocs.Classification.SentimentClassifier();

// Sentimentanalyse des englischen Textes.
var response = classifier.Classify("Experience is simply the name we give our mistakes");
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

// Sentiment-Analyse des chinesischen Textes mit demselben Klassifikator und Sentiment3-Taxonomie (negativ/neutral/positiv).
response = classifier.Classify("熟能生巧", taxonomy: Taxonomy.Sentiment3);
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

Unterstützung und Lernressourcen

Back to top
 Deutsch