Java API를 통한 문서 검색 및 색인 생성

모든 인기 있는 문서 형식에서 텍스트 검색 조작을 수행하는 Java 애플리케이션 빌드.


무료 평가판 다운로드

GroupDocs.Search for Java를 사용하면 최종 사용자가 이전과는 다른 방식으로 검색 작업을 수행할 수 있도록 하는 비즈니스 응용 프로그램을 생성할 수 있습니다. Java API를 사용하면 기본에서 고급 수준의 텍스트 검색 기능을 작동할 수 있습니다. 여러 인덱스를 만들고 병합합니다. 단순, 부울, 정규식(Regex), 퍼지 및 기타 유형의 쿼리를 사용하여 인덱스를 빠르고 스마트하게 검색합니다. GroupDocs.Search for Java는 널리 사용되는 모든 파일 형식을 지원하므로 파일, 문서, 이메일 및 아카이브에서 필요한 정보를 가져올 수 있습니다.

GroupDocs.Java 기능 검색

인덱싱 및 검색 작업

인덱싱은 GroupDocs.Search for Java에서 데이터를 수집하고 정확하고 효율적인 검색 작업을 위해 데이터를 저장 및 구문 분석하는 데 사용됩니다. Java용 GroupDocs.Search는 검색을 수행하기 위해 이러한 색인을 자주 사용합니다.

  • Create Index: Index 폴더를 생성하고 해당 폴더에 문서를 추가/인덱싱합니다.
  • 인덱스 로드: 기존 인덱스를 로드합니다.
  • 색인에 문서 추가: 기존 색인에 문서를 비동기식으로 추가합니다.
  • 인덱스 업데이트: 문서가 수정, 추가 또는 삭제될 때마다 기존 인덱스를 업데이트합니다. 이렇게 하면 검색 결과가 최신 상태로 유지됩니다.
/ Creating index
Index index = new Index("c:\\MyIndex");
// 인덱스에 문서 추가
index.addToIndex("c:\\MyDocuments");
// 'principal', 'principle', 'principles', 'principally'가 있는 문서에서 '영향' 또는 '효과' 단어 검색
SearchResults results = index.search("?ffect & princip?(2~4)");

여러 인덱스를 병합하여 검색 효율성 향상

GroupDocs.Search for Java API는 여러 인덱스를 공통 인덱스로 병합하는 기능을 제공합니다. 자주 수정되는 인덱스의 경우 여러 개의 델타 인덱스가 생성됩니다. 그러나 이 접근 방식은 검색 성능을 저하시킵니다. GroupDocs.Search for Java는 다양한 델타 인덱스를 병합하여 하나의 공통 인덱스를 생성하여 이러한 병목 현상을 극복합니다. 이 공통 병합 인덱스에는 병합된 델타 인덱스의 모든 정보가 포함됩니다. 이 접근 방식은 델타 인덱스를 변경하지 않은 상태로 유지하면서 검색 효율성을 크게 향상시킵니다. 이 프로세스를 추가로 조정하기 위해 다양한 기능을 구성할 수 있습니다..

다양한 키보드 레이아웃의 검색어 인식

GroupDocs.Search for Java는 키보드 레이아웃과 일치하지 않는 검색어를 인식합니다. 현재 GroupDocs.Search for Java는 88개 언어와 164개 키보드 레이아웃을 성공적으로 인식할 수 있습니다.

형태소 단어 형식을 사용하여 검색

GroupDocs.Search for Java를 사용하면 다양한 단어 형식을 자유롭게 검색할 수 있습니다. 특정 명사의 단수형과 복수형을 검색할 수 있습니다. 또는 동사의 모든 형태를 검색하도록 선택할 수 있습니다. 어근, 3인칭 단수, 단순과거 등 다양한 형태로 검색이 가능합니다. 영어가 아닌 언어의 경우 사용자 지정 단어 형식을 구성할 수 있습니다..

지원 및 학습 리소스

GroupDocs.Search는 다른 인기 있는 개발 환경을 위한 문서 보기 API를 제공합니다.

Back to top
 한국인