GroupDocs.Parser 개요
Java 애플리케이션에서 문서 구문 분석을 수행하기 위한 API
문서에서 데이터 추출
Java API를 사용하면 Office 문서, 이메일, 첨부 파일, 아카이브 등 다양한 파일 형식에서 텍스트, 메타데이터, 이미지를 검색할 수 있습니다. 이 강력한 도구는 데이터 분석, 검색 엔진 색인화 또는 콘텐츠 관리 시스템과 같은 다양한 응용 프로그램을 위해 이러한 파일에 포함된 중요한 정보에 효율적으로 액세스하고 처리하는 데 도움이 됩니다.
문서 분석
PDF 양식에서 하이퍼링크, 표, QR 코드, 바코드 및 데이터와 같은 다양한 요소를 추출합니다. 또한 사용자 정의 템플릿을 사용하여 문서에서 원하는 정보를 구문 분석합니다.
결과 맞춤설정
Java API를 사용하면 원시, 구조화, HTML 또는 마크다운과 같은 다양한 형식의 데이터를 검색할 수 있습니다. 또한 API는 문서 텍스트 내에서 특정 단어나 문구를 찾는 검색 기능을 제공합니다.