通过 Java API 搜索和索引文档

构建 Java 应用程序以执行所有流行文档格式的文本搜索操作。


下载免费试用版

GroupDocs.Search for Java 允许您生成允许您的最终用户以前所未有的方式执行搜索操作的业务应用程序。我们的 Java API 使用户能够操作基本到高级的文本搜索功能。创建和合并多个索引。使用简单、布尔、正则表达式 (Regex)、模糊和其他类型的查询来快速、智能地搜索索引。您可以从文件、文档、电子邮件和档案中获取所需的信息,因为 GroupDocs.Search for Java 支持所有流行的文件格式。

GroupDocs.Search for Java 特征

使用异步多线程在磁盘或内存中构建索引

查看索引创建和更新进度

选择性地跳过特定文件的索引并跳过特定单词以更快地索引

在索引和导出到文件期间执行导入或使用列表来修改字符

索引错误时重新加载索引并警告用户设置矛盾

最新处理文件的索引状态通知

在其他 ZIP 档案中索引压缩档案并获取档案中的索引文件列表

通过紧凑索引和密码保护文档节省空间

从索引或源文件中提取文档文本

HTML 格式的教科书建议到文件并生成 URL 以在 HTML 中导航搜索结果

在索引期间向每个文档添加任意附加字段

为模糊搜索配置相似度并显示最佳结果

通过模糊搜索智能管理错别字

Use 分面和布尔值 Search Simultaneously

配置和执行同义词搜索并巧妙地处理谐音词

使用日期范围和区分大小写作为搜索参数

通过 Aspose.Email API 建立索引以搜索和浏览电子邮件

使用带有拼写检查和外卡的搜索短语并在查询中跳过特殊字符

通过组合多个查询制作单个对象树

将搜索划分为更小的块以快速搜索巨大的索引

来自流和数据结构的索引文档

在搜索结果中设置文档过滤

将英语同义词添加到默认同义词词典

为每个找到的单词启用准确的出现次数,以在拼写错误的情况下提供替代单词建议

将文本属性添加到索引文档而不重新索引

基于字符执行索引和搜索操作

非文本文档格式的索引元数据

索引 and Search Operation

GroupDocs.Search for Java 使用索引来收集数据,并存储和解析数据以实现准确高效的搜索操作。 GroupDocs.Search for Java 经常使用此类索引来执行搜索。

  • 创建索引:创建索引文件夹并将文档添加/索引到该文件夹​​。
  • 加载索引:加载现有索引。
  • 将文档添加到索引:将文档异步添加到现有索引。
  • 更新索引:在修改、添加或删除文档时更新现有索引。这使搜索结果保持最新。
/ 创建索引
Index index = new Index("c:\\MyIndex");
// 将文档添加到索引
index.addToIndex("c:\\MyDocuments");
// 在文档中搜索单词“影响”或“影响 'principal', 'principle', 'principles', or 'principally'
SearchResults results = index.search("?ffect & princip?(2~4)");

合并多个索引以提高搜索效率

GroupDocs.Search for Java API 提供了将多个索引合并为一个公共索引的功能。对于经常修改的索引,会创建多个增量索引。然而,这种方法会使搜索性能变慢。 GroupDocs.Search for Java 通过合并各种 delta 索引来创建一个通用索引,从而克服了这一瓶颈。这个共同的合并索引包含合并的增量索引的所有信息。这种方法在保持增量索引不变的同时显着提高了搜索效率。您可以配置各种功能以进一步调整此过程.

识别不同键盘布局的搜索查询

GroupDocs.Search for Java 可识别与您的键盘布局不匹配的搜索查询。目前,GroupDocs.Search for Java 可以成功识别 88 种语言和 164 种不同的键盘布局。

使用形态词形式搜索

使用 GroupDocs.Search for Java,您可以自由搜索各种单词形式。您可以搜索特定名词的单数和复数形式。或者您可以选择搜索动词的所有形式。还可以搜索词根、第三人称单数和一般过去时以及各种其他形式。对于非英语语言,您可以配置自定义单词形式.

支持和学习资源

GroupDocs.Search 为其他流行的开发环境提供文档查看 API

Back to top
Zh