GroupDocs.Parser 한눈에 보기
Python 애플리케이션에서 고정밀 문서 파싱을 수행하기 위한 Document Parser SDK
문서에서 데이터 추출
GroupDocs.Parser for Python via .NET API를 사용하면 Office 문서, 이메일, 첨부 파일 및 압축 파일과 같은 다양한 파일 형식에서 텍스트, 메타데이터 및 이미지를 가져올 수 있습니다. 이 강력한 도구는 데이터 분석, 검색 엔진 인덱싱 또는 콘텐츠 관리 시스템과 같은 다양한 애플리케이션에서 이러한 파일에 포함된 중요한 정보를 효율적으로 액세스하고 처리하는 데 도움이 됩니다.
문서 파싱
PDF 양식에서 하이퍼링크, 표, QR 코드, 바코드 및 데이터를 포함한 다양한 요소를 추출합니다. 또한 사용자 정의 템플릿을 사용하여 문서에서 원하는 정보를 파싱할 수 있습니다.
결과 맞춤화
Python API를 사용하면 원시, 구조화, HTML 또는 Markdown과 같은 다양한 형식으로 데이터를 가져올 수 있습니다. 또한 API는 문서 텍스트 내에서 특정 단어나 구문을 찾을 수 있는 검색 기능을 제공합니다.

