개발자 친화적인 Document Parser SDK로 50개 이상의 문서 및 이미지 형식에서 텍스트, 이미지, 바코드, 메타데이터 및 표를 추출합니다.
.NET, Java 및 Python 애플리케이션에 최소한의 코드 작성으로 고성능 문서 파싱을 통합하세요.
유연한 템플릿과 고급 API를 사용해 파싱 규칙을 맞춤 설정하고 정제된 구조화 데이터 출력을 제공합니다.
PDF, Office 문서, 이미지, 이메일 및 아카이브에서 구조화 및 비구조화 데이터를 추출하는 강력한 Document Parser SDK.
다양한 파일 형식에서 텍스트 정보를 추출합니다
다양한 소스에서 시각적 콘텐츠를 가져옵니다
맞춤 템플릿을 생성하고 이를 사용해 특정 정보를 파싱합니다
PDF 양식은 사용자가 입력할 수 있는 필드를 포함한 디지털 문서입니다
C#, Java 및 Python에서 일반적인 GroupDocs.Parser 작업의 몇 가지 사용 사례
// 원하는 파일을 전달하여 Parser 클래스의 인스턴스를 생성합니다.
using (var parser = new Parser("source.pdf"))
{
// 텍스트 추출
using (var textReader = parser.GetText())
{
// 추출된 텍스트를 처리합니다.
Console.WriteLine(textReader?.ReadToEnd());
}
}
// 원하는 파일을 전달하여 Parser 클래스의 인스턴스를 생성합니다.
try (Parser parser = new Parser("source.pdf"))
{
// 텍스트 추출
try (TextReader reader = parser.getText())
{
// 추출된 텍스트를 처리합니다.
System.out.println(reader == null
? ""
: reader.readToEnd());
}
}
from groupdocs.parser import Parser
# 원하는 파일을 전달하여 Parser 클래스의 인스턴스를 생성합니다.
with Parser("source.pdf") as parser:
# 텍스트 추출
text = parser.get_text()
# 추출된 텍스트를 처리합니다.
print(text)
GroupDocs.Parser Document Parser SDK는 Office 문서, PDF, 이미지, 이메일, 아카이브 등 다양한 형식에 대한 파싱 작업을 가능하게 합니다.
우리 라이브러리 성과의 주요 지표를 확인하세요
GroupDocs.Parser는 50개 이상의 인기 파일 포맷을 지원합니다.
GroupDocs.Parser .NET용 NuGet 패키지는 1,600,000회 이상 다운로드되었습니다.
GroupDocs.Parser는 Maven에서 18,000회 다운로드되었습니다. 강력한 Java 파싱 기능.
유명 기업과 개인 개발자 모두 혁신적인 솔루션을 구축하기 위해 GroupDocs 제품을 선호합니다.
GroupDocs 라이브러리는 전 세계적으로 유명하고 저명한 브랜드에서 사용됩니다.
GroupDocs.Parser 라이브러리는 다음 운영 체제와 프레임워크를 지원합니다:
가장 자주 묻는 질문에 대한 답변입니다.
클라우드 기반 REST API 및 SDK를 사용하여 모든 애플리케이션에 문서 파싱 기능을 통합하십시오.
지원되는 다양한 인기 파일 형식 전반에 걸쳐 문서를 파싱하기 위한 RESTful 문서 파서 클라우드 API용 cURL 명령.
Microsoft .NET 애플리케이션에서 사용자 정의 템플릿으로 이미지, 텍스트, 문서 정보를 추출하거나 모든 문서를 파싱할 수 있습니다.
Java 개발자를 위한 클라우드 SDK로 Java 기반 애플리케이션에서 문서를 파싱하고 문서 정보 및 데이터를 추출합니다.
웹 기반 문서 파서 앱으로 브라우저에서 직접 50개 이상의 인기 파일 형식에서 데이터를 추출할 수 있습니다.