GroupDocs.Search 使在 PDF 文档中搜索文本对于 Node.js via Java 应用程序变得简便和高效。
- 创建一个目录以存储搜索索引。
- 选择包含文档的文件夹。
- 设置搜索选项仅包括 PDF 文件。
- 运行搜索并检索结果。
GroupDocs.Search 使在 PDF 文档中搜索文本对于 Node.js via Java 应用程序变得简便和高效。
const searchLib = require('@groupdocs/groupdocs.search')
// 定义用于存储搜索索引的目录
const index = new searchLib.Index("c:/MyIndex");
// 指定包含可搜索文档的文件夹
index.add("c:/MyDocuments");
// 限制搜索到特定文件格式
const options = new searchLib.SearchOptions();
options.SearchDocumentFilter =
searchLib.SearchDocumentFilter.createFileExtension(".pdf");
// 检索并处理搜索结果
const result = index.search("Lorem");
GroupDocs.Search for Node.js via Java 通过索引超过 70 种文件格式来提高文档搜索的效率。通过先进的搜索技术优化内容检索。
提取并定位流行文档格式中的文本,如 PDF、Word 文件、电子表格和演示文稿。支持模糊搜索、同音词和通配符查询。
通过创建可重用的索引加快搜索速度。在处理大型文档集合时提高速度和效率。
在超过 80 种语言的文档中搜索。识别键盘布局和单词变体以提高准确性。
通过过滤器、正则表达式、大小写敏感性和其他灵活设置微调搜索结果。
const searchLib = require('@groupdocs/groupdocs.search')
// 配置索引以排除不需要的文件格式
IndexSettings settings = new IndexSettings();
DocumentFilter fileExtensionFilter =
searchLib.DocumentFilter.createFileExtension(".odp", ".png", ".rtf");
DocumentFilter invertedFilter =
searchLib.DocumentFilter.createNot(fileExtensionFilter);
settings.setDocumentFilter(invertedFilter);
Index index = new searchLib.Index("c:/MyIndex", settings);
// 指定包含文档的目录
index.add("c:/MyDocuments");
// 处理搜索输出以供进一步使用
const result = index.Search("Lorem", options);
// 处理搜索输出以供进一步使用
console.log('Documents: ' + result.getDocumentCount());
console.log('Occurrences: ' + result.getOccurrenceCount());
GroupDocs.Search 支持超过 70 种文件类型,允许在各种办公和商业文档中高效搜索文本。