GroupDocs.Search 允许在 PDF 文档中进行快速高效的文本搜索,非常适合 Java 应用程序。
- 指定一个文件夹来存储搜索索引。
- 选择包含您的文档的文件夹。
- 配置搜索选项,将结果限制为 PDF 文档。
- 运行搜索并获取结果。
GroupDocs.Search 允许在 PDF 文档中进行快速高效的文本搜索,非常适合 Java 应用程序。
// 存储可重用搜索索引的目录
Index index = new Index("c:/MyIndex");
// 包含文档的文件夹
index.add("c:/MyDocuments");
// 按文档格式筛选搜索
SearchOptions options = new SearchOptions();
options.SearchDocumentFilter =
SearchDocumentFilter.createFileExtension(".pdf");
// 检索搜索结果
SearchResult result = index.search("Lorem");
GroupDocs.Search for Java 在超过 70 种文件格式中提供高级文本搜索。索引功能加速搜索并提高文档管理效率。

在常见文档格式中查找文本,例如 PDF、Word 文件、演示文稿和电子表格。支持多种搜索方法,包括模糊搜索、同音词和通配符。
创建和重用搜索索引以增强搜索速度和效率,特别是在大型文档集合中。
支持在超过 80 种语言的文档中搜索。识别不同的键盘布局和单词变体以提高准确性。
通过过滤器、正则表达式和其他高级搜索设置缩小搜索结果。
// 设置排除某些文件格式的索引
IndexSettings settings = new IndexSettings();
DocumentFilter fileExtensionFilter =
DocumentFilter.createFileExtension(".odp", ".png", ".rtf");
DocumentFilter invertedFilter = DocumentFilter.createNot(fileExtensionFilter);
settings.setDocumentFilter(invertedFilter);
Index index = new Index("c:/MyIndex", settings);
// 指定文档存储路径
index.add("c:/MyDocuments");
// 检索搜索结果
SearchResult result = index.search("Lorem", options);
// 处理并使用搜索结果
System.out.println("Documents: " + result.getDocumentCount());
System.out.println("Occurrences: " + result.getDocumentCount());
GroupDocs.Search 支持超过 70 种文件格式,便于在被广泛使用的办公文档中进行搜索。