GroupDocs.Search 概述

发现Java Java库的强大文本搜索能力。

Illustration search

Java 中的索引和搜索操作

使用GroupDocs.Search for Java,您可以有效地收集、存储和分析数据,以创建详细的索引,从而实现更快速、更准确的搜索。

通过合并索引优化搜索

轻松结合多个索引,使用GroupDocs.Search for Java来优化搜索。通过将多个增量索引合并为单个高性能索引来减少小的增量索引的影响。

支持多语言键盘布局

使用GroupDocs.Search for Java跨不同语言和键盘布局进行搜索。它支持88种语言和164种键盘配置,灵活多变无与伦比。

形态学搜索能力

使用GroupDocs.Search for Java查找不同的单词形式,例如单数/复数名词或动词变化。为英语和其他语言定制搜索选项。

平台独立性

GroupDocs.Search for Java 与主要操作系统和软件包管理器兼容。

Amazon
Docker
Azure
Eclipse
IntelliJ
Windows
Linux
Maven

支持的文件格式

使用GroupDocs.Search for Java处理广泛的文件格式。查看完整列表

流行的办公格式

  • 便携式: PDF
  • Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM
  • Excel: XLS, XLSX, XLSM, XLT, XLTX, XLTM, XLSB, XLA, XLAM, CSV, TSV
  • PowerPoint: PPT, PPTX, POT, POTX, PPS, PPSX, PPTM, PPSM, POTM
  • OpenDocument: ODT, ODP, ODS, OTT, OTS
  • 文本: TXT, RTF

媒体格式

  • 流行图片格式: BMP, JP2, PNG, EMF, WMF, JPG, PSD
  • 多页图像: GIF, WEBP, TIFF
  • 音频: MP3, WAV
  • 视频: AVI, MOV, QT, FLV, ASF

其他

  • 电子邮件: PST, OST, MSG, EML, EMLX
  • Microsoft Visio: VSD, VSS
  • 网页: XML, HTM, HTML, XHTML, MHT, MHTML
  • 其他: TORRENT, ZIP, DCM, DJVU, EPUB, FB2

GroupDocs.Search for Java 的功能

有效管理文档内容,提供支持PDF、DOCX、XLSX、PPTX等格式的高级搜索能力。

Feature icon

可定制的搜索参数

使用日期范围和区分大小写筛选器来改进搜索。

Feature icon

增强的拼写检查

通过拼写检查、通配符和忽略特殊字符有效搜索。

Feature icon

过滤搜索结果

应用筛选器,以根据特定文档类型或标准关注搜索结果。

Feature icon

数据的导入和导出

轻松导入索引数据或将结果导出到文件以供进一步使用。

Feature icon

跳过不必要的文件

通过排除特定文件或单词来优化索引。

Feature icon

HTML和URL处理

提取HTML内容到文件,并为搜索结果生成URL链接。

Feature icon

在大型索引中快速搜索

通过将大型索引分割为可管理的块来加速搜索操作。

Feature icon

基于流的索引

直接从流或数据结构中索引数据。

Feature icon

处理拼写错误的查询

检测拼写错误,并建议替代词以提高搜索准确性。

Feature icon

全面的归档支持

索引嵌套归档,并检索ZIP文件中详细的文件列表。

Feature icon

节省磁盘空间的索引

通过紧凑的索引节省磁盘空间,并处理受密码保护的文件。

Feature icon

自定义同义词支持

扩展同义词字典,以增强搜索精度,提供定制选项。

代码示例

通过这些代码示例试用GroupDocs.Search for Java功能。

通过模糊匹配提升搜索准确性

探索GroupDocs.Search for Java的灵活性,通过先进的模糊搜索功能,管理内容。 了解更多

如何处理搜索结果

// 创建索引
Index index = new Index("C:/IndexFolder");
index.add("C:/DocumentFolder");

// 设置搜索选项
SearchOptions options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3));

// 搜索包含'water'这个词或短语'Lorem ipsum'的文档
String query = "water OR \"Lorem ipsum\"";
SearchResult result = index.search(query, options);

// 处理搜索结果
System.out.println("Documents: " + result.getDocumentCount());
System.out.println("Total occurrences: " + result.getOccurrenceCount());
for (int i = 0; i < result.getDocumentCount(); i++) {
    FoundDocument document = result.getFoundDocument(i);
    System.out.println("Document: " + document.getDocumentInfo().getFilePath());
    System.out.println("Occurrences " + document.getOccurrenceCount());
    }

使用正则表达式精细化结果

在GroupDocs.Search for Java中使用正则表达式,以创建精确且详细的搜索结果。 探索先进技术

如何使用正则表达式搜索

// 创建索引
Index index = new Index("C:/IndexFolder");
index.add("c:/DocumentFolder");

// 搜索文本形式的短语

// 第一个插入符号字符表示这是一个正则表达式搜索查询
String query = "^^(.)\\1{1,}";
// 搜索单词开头的两个或多个相同字符
SearchResult result = index.search(query);

准备好开始了吗?

免费下载 GroupDocs.Search 或获取试用许可证以获得完全访问权限!

有用的资源

探索文档,代码样本和社区支持,以增强您的体验。

临时许可提示

1
使用您的工作电子邮件地址进行注册。不允许使用免费邮件服务。
2
使用第二步中的获取临时许可证按钮。
 中国人