GroupDocs.Search for Java

智能文档文本搜索

使用 GroupDocs.Search for Java,您可以在您的 Java 应用程序中无缝搜索和提取多种文档类型的文本。

在 DOCX 文件中执行文本搜索

GroupDocs.Search 使得在 DOCX 文件中使用复杂的逻辑和索引进行搜索变得简单,从而提高 Java 应用程序中的搜索准确性。

  1. 设置一个目录以存储搜索索引。
  2. 选择一个包含 DOCX 文件的文件夹。
  3. 定义额外的搜索选项。
  4. 执行搜索并分析结果。
// 设置用于存储搜索索引的目录
Index index = new Index("c:/MyIndex");

// 指定包含可搜索文档的文件夹
index.add("c:/MyDocuments");

// 启用同音词搜索以匹配发音相似的单词
SearchOptions options = new SearchOptions();
options.setUseHomophoneSearch(true);

// 执行高级搜索查询
SearchResult result = index.search("metis", options);
Maven XML
点击复制
已复制
更多示例 文档

增强的搜索和索引能力

GroupDocs.Search for Java 简化了跨 70 多种文档格式的文本搜索和索引,提供高效工具以快速管理和检索信息。

GroupDocs.Search 的核心功能

全面的文本搜索

在多种文档格式中查找文本,例如 PDF、Word 文档、PowerPoint 演示文稿和电子表格。使用精确匹配、模糊搜索和通配符运算符以获得细致的搜索结果。

针对大型数据的优化索引

创建结构化索引以加速搜索,使您能够高效地浏览大量文档库。

支持多种语言

在 80 多种语言中进行搜索,内置支持不同的键盘布局和词语形态变化,提高精确度。

灵活的搜索设置

通过选项如大小写敏感、基于日期的过滤以及排除特定单词的能力来自定义搜索,以获得精确结果。

实现高级搜索查询

此示例演示如何有效地使用搜索查询在 DOCX 文档中进行搜索。

Java

// 定义搜索索引的目录
Index index = new Index("c:/MyIndex");
    
// 提供文档的文件路径
index.add("c:/MyDocuments");

// 输入加密文档的密码
index.getDictionaries().getDocumentPasswords().add("protected.docx", "123456");

// 启用模糊搜索以检测相似单词
SearchOptions options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new SimilarityLevel(0.8));

// 获取搜索结果
SearchResult result = index.Search("Loarem", options);

// 处理和分析搜索结果
System.out.println("Documents: " + result.getDocumentCount());
System.out.println("Occurrences: " + result.getDocumentCount());
Maven XML
点击复制
已复制
更多示例 文档

GroupDocs.Search 是做什么的?

GroupDocs.Search for Java 是一个强大的文档搜索和索引库,支持超过 70 种文件格式,包括 PDF、Word、PowerPoint、Excel、图像和 ZIP 压缩档案。它为大规模文档集合提供快速、精确和可扩展的搜索功能。
了解更多
About illustration

准备好开始了吗?

免费下载 GroupDocs.Search 或获取试用许可证以获得完全访问权限!

有用的资源

探索文档,代码样本和社区支持,以增强您的体验。

主要功能概述

探索旨在提高效率和精确度的高性能文本搜索功能。

使用 GroupDocs.Search 在 DOCX 文档中查找信息

GroupDocs.Search 支持超过 70 种格式,包括办公文件,启用快速搜索和高级索引功能。

临时许可提示

1
使用您的工作电子邮件地址进行注册。不允许使用免费邮件服务。
2
使用第二步中的获取临时许可证按钮。
 中国人