.NET 텍스트 및 문서 분류 API

IAB-2, 문서 및 감정 분류 내에서 미리 정의된 태그 또는 범주를 사용하여 파일 및 텍스트 분류기 기능으로 .NET 애플리케이션을 강화합니다..


무료 평가판 다운로드

텍스트 감정 분석 및 텍스트 분류는 구조화되지 않은 텍스트 데이터에서 의미 있는 통찰력을 추출하는 데 사용할 수 있는 두 가지 강력한 기술이며 다양한 산업 분야에서 수많은 실용적인 응용 프로그램을 보유하고 있습니다. 이러한 기술은 소셜 미디어 모니터링에서 고객 피드백 분석, 뉴스 기사 분류, 스팸 이메일 감지 등에 이르기까지 광범위한 사용 사례에 적용될 수 있습니다.

감정 분석은 텍스트 조각의 감정적 톤을 식별하는 프로세스입니다. 감정 분석의 목표는 텍스트에서 주관적인 정보를 추출하여 작성자의 의견이나 감정 상태를 이해하는 것입니다. 이 기술은 소셜 미디어 모니터링, 고객 피드백 분석, 브랜드 평판 관리 등에 적용하여 피드백이나 언급을 긍정적, 부정적 또는 중립적 범주로 분류할 수 있습니다.

텍스트 분류는 텍스트를 미리 정의된 클래스 또는 범주로 분류하는 프로세스입니다. 이 기술은 대량의 텍스트 문서 모음을 구성하거나 텍스트 데이터 스트림에서 관련 없는 정보를 필터링하는 데 사용할 수 있습니다. 텍스트 분류는 의미 체계, 감정 또는 IAB(Interactive Advertising Bureau) 범주와 같은 다양한 기준을 기반으로 할 수 있습니다. IAB 기반 분류는 IAB 범주를 기반으로 텍스트를 분류하는 데 사용됩니다. 이 접근 방식은 광고 타겟팅을 위해 콘텐츠를 분류하기 위해 광고에서 자주 사용됩니다. 예를 들어 소프트웨어 개발자는 IAB 기반 분류를 사용하여 웹 사이트 콘텐츠를 예술 및 엔터테인먼트, 건강 및 피트니스 또는 여행과 같은 다양한 범주로 분류할 수 있습니다.

문서 분류는 문서를 내용에 따라 다른 범주로 구성하는 것과 관련된 텍스트 분류의 일반적인 사용 사례입니다. 이는 정리하고 분석해야 하는 비정형 데이터가 많은 법률, 금융, 의료 등 다양한 산업에서 유용할 수 있습니다. 문서 분류를 구현하는 한 가지 방법은 PDF, DOC, DOCX, RTF 및 TXT를 비롯한 광범위한 문서 형식을 지원하는 강력한 텍스트 분류 라이브러리인 GroupDocs.Classification을 사용하는 것입니다. 당사의 솔루션은 매우 정확하고 신뢰할 수 있는 기계 학습 알고리즘을 기반으로 구축되어 텍스트 데이터를 기반으로 더 현명한 결정을 내릴 수 있습니다. 소프트웨어 개발자는 텍스트 감정 분석 및 텍스트 분류를 사용하여 브랜드 언급을 추적하고 감정별로 분류하는 소셜 미디어 모니터링 도구, 주제별로 기사를 분류하는 뉴스 수집기, 스팸 이메일 필터와 같은 다양한 애플리케이션을 만들 수 있습니다. 텍스트 분류를 사용하여 스팸 이메일을 식별 및 필터링하거나 구조화되지 않은 텍스트 데이터에서 다른 의미 있는 통찰력을 추출하고 사용자에게 가치를 제공하는 애플리케이션을 구축합니다.

GroupDocs.Classification의 가장 좋은 기능 중 하나는 유연성입니다. 이는 거의 모든 유형의 문서로 텍스트를 분류할 수 있음을 의미합니다. GroupDocs.Classification의 또 다른 뛰어난 기능은 사용자 친화적인 API입니다. 몇 줄의 코드만으로 라이브러리를 자신의 애플리케이션에 통합하고 텍스트 분류를 바로 시작할 수 있습니다. 우리의 API는 사용하기 쉽고 잘 문서화되어 있으므로 즉시 시작하고 실행할 수 있습니다. 문서 분류에 GroupDocs.Classification을 사용하면 기업은 문서를 구성하고 분석하는 프로세스를 자동화하여 시간과 리소스를 절약할 수 있습니다. 이를 통해 보다 효율적인 워크플로, 더 나은 의사 결정, 궁극적으로 비즈니스 성과 개선으로 이어질 수 있습니다.

고급 텍스트 및 문서 분류 API 기능

정확한 문서 분류

GroupDocs.Classification API는 다양한 문서 형식에 대한 분류를 지원합니다. 아래 C# 코드 예제는 최상의 결과 3개를 반환하여 문서 분류를 사용하여 현재 폴더에서 PDF 파일을 분류하는 방법을 보여줍니다.

// 범용 분류기(IAB-2, Documents, Sentiment Analysis)를 초기화합니다.
var classifier = new GroupDocs.Classification.Classifier();

// 문서 분류로 pdf 파일을 분류하고 가장 가능성이 높은 3개의 카테고리를 반환합니다.
var response = classifier.Classify("document.pdf", ".", 3, Taxonomy.Documents);
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

정확한 텍스트 분류

GroupDocs.Classification API는 텍스트 분류도 지원합니다. 텍스트 분류는 IAB-2, Documents, Sentiment 및 Sentiment3의 4가지 분류로 수행할 수 있습니다. 아래 C# 코드 예제에서는 최상의 결과를 반환하여 기본(IAB-2) 분류로 텍스트를 분류하는 방법을 보여줍니다.

// 범용 분류기(IAB-2, Documents, Sentiment Analysis)를 초기화합니다.
var classifier = new GroupDocs.Classification.Classifier();

// IAB-2 분류법으로 텍스트를 분류하고 최상의 범주를 반환합니다.
var response = classifier.Classify("Classify text using the default IAB-2 taxonomy");
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

정확한 다국어 감정 분석

.NET용 GroupDocs.Classification을 사용하면 영어, 중국어, 스페인어 및 독일어로 도메인 간 감정 분석(분류)을 수행할 수 있습니다. .NET용 GroupDocs.Classification은 적절한 언어를 자동으로 감지합니다. 감정 분석 API 사용 사례는 다음 C# 코드로 설명됩니다.

// 교차 도메인 다국어 감정 분류기를 초기화합니다. 
// SentimentClassifier는 영어, 중국어, 스페인어, 독일어로 다국어 분류를 지원합니다.
var classifier = new GroupDocs.Classification.SentimentClassifier();

// 영어 텍스트의 감정 분석.
var response = classifier.Classify("Experience is simply the name we give our mistakes");
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

// 동일한 분류자 및 Sentiment3(Negative/Neutral/Positive) 분류법을 사용하여 중국어 텍스트의 감정 분석.
response = classifier.Classify("熟能生巧", taxonomy: Taxonomy.Sentiment3);
Console.WriteLine($"{response.BestClassName}: {response.BestClassProbability}");

지원 및 학습 리소스

Back to top
 한국인