GroupDocs.Search 概述

Node.js JavaScript库进行文本搜索

Illustration search

Node.js 索引和搜索操作

在GroupDocs.Search for Node.js via Java中进行索引,收集、存储和解析数据,以实现精确和高效的搜索操作。这些索引通常用于执行搜索。

合并多个索引以增强搜索效率

GroupDocs.Search for Node.js via Java API允许将多个索引合并为一个。频繁的修改会创建多个增量索引,可能会减慢搜索性能。我们的解决方案将这些增量索引合并为一个公共索引,包含所有合并增量索引的信息,显著提高搜索效率,同时保持增量索引不变。可以配置多种功能以微调此过程。

识别来自不同键盘布局的搜索查询

GroupDocs.Search for Node.js via Java可以识别与键盘布局不匹配的搜索查询。目前支持88种语言和164种不同的键盘布局。

使用形态学单词形式搜索

使用GroupDocs.Search for Node.js via Java,您可以搜索多种单词形式,例如单数和复数名词,或动词的所有形式。英语和非英语语言可以针对特定单词形式进行自定义。

平台独立性

GroupDocs.Search for Node.js via Java支持所有流行操作系统和软件包管理器。

Windows
macOS
Linux
NPM
NuGet
Amazon
Docker
Azure
VS Code
Eclipse
IntelliJ

支持的文件格式

GroupDocs.Search for Node.js via Java可以处理广泛的文件格式。探索完整列表

流行的办公格式

  • 便携式: PDF
  • Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM
  • Excel: XLS, XLSX, XLSM, XLT, XLTX, XLTM, XLSB, XLA, XLAM, CSV, TSV
  • PowerPoint: PPT, PPTX, POT, POTX, PPS, PPSX, PPTM, PPSM, POTM
  • OpenDocument: ODT, ODP, ODS, OTT, OTS
  • 文本: TXT, RTF

媒体格式

  • 流行图片格式: BMP, JP2, PNG, EMF, WMF, JPG, PSD
  • 多页图像: GIF, WEBP, TIFF
  • 音频: MP3, WAV
  • 视频: AVI, MOV, QT, FLV, ASF

其他

  • 电子邮件: PST, OST, MSG, EML, EMLX
  • Microsoft Visio: VSD, VSS
  • 网页: XML, HTM, HTML, XHTML, MHT, MHTML
  • 其他: TORRENT, ZIP, DCM, DJVU, EPUB, FB2

GroupDocs.Search for Node.js via Java 的功能

使用我们的高级搜索引擎控制业务文档内容,支持流行的文件格式,包括PDF、DOCX、XLSX、PPTX等。

Feature icon

灵活参数

使用日期范围和区分大小写作为搜索参数

Feature icon

拼写检查搜索

使用拼写检查和通配符的搜索短语,跳过查询中的特殊字符

Feature icon

结果过滤

在搜索结果中设置文档过滤

Feature icon

导入和导出

导入或使用列表修改索引期间的字符,并导出到文件

Feature icon

跳过不必要的数据

有选择性地跳过特定文件的索引,和跳过特定单词以更快地索引

Feature icon

URL处理

提取HTML格式的文本到文件,并生成URL以在HTML中导航搜索结果

Feature icon

快速搜索

将搜索分解为更小的块,以快速搜索大型索引

Feature icon

流处理

从流和数据结构中索引文档

Feature icon

处理拼写错误

为每个找到的单词提供准确的出现次数,并在拼写错误时提供替代词建议

Feature icon

归档支持

索引嵌套的ZIP归档,并检索归档中索引文件的列表

Feature icon

节省磁盘空间

以压缩的方式索引,占用更少空间,并索引密码保护的文档

Feature icon

自定义同义词

将英语同义词添加到默认同义词字典

代码示例

通过示例探索GroupDocs.Search for Node.js via Java的功能

使用’模糊’搜索提升生产力

享受GroupDocs.Search for Node.js via Java的灵活功能,通过复杂的搜索算法增强文档内容控制。了解更多

如何处理搜索结果

const searchLib = require('@groupdocs/groupdocs.search');

// 创建索引
const index = new searchLib.Index('c:/IndexFolder');
index.add('c:/DocumentFolder');

// 设置搜索选项
const options = new searchLib.SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3));

// 搜索包含'water'这个词或短语'Lorem ipsum'的文档
const query = 'water OR "Lorem ipsum"';
const result = index.search(query, options);

// 处理搜索结果
console.log('Documents: ' + result.getDocumentCount());
console.log('Total occurrences: ' + result.getOccurrenceCount());
for (let i = 0; i < result.getDocumentCount(); i++) {
    const document = result.getFoundDocument(i);
    console.log('Document: ' + document.getDocumentInfo().getFilePath());
    console.log('Occurrences:  + document.getOccurrenceCount());
    }

正则表达式可用于高级搜索场景

GroupDocs.Search for Node.js via Java允许我们使用正则表达式来缩小搜索结果。深入了解高级搜索技术

如何使用正则表达式搜索

const searchLib = require('@groupdocs/groupdocs.search');

// 创建索引
const index = new searchLib.Index('c:/IndexFolder');
index.add('c:/DocumentFolder');

// 搜索文本形式的短语

// 第一个插入符号字符表示这是一个正则表达式搜索查询
const query = '^^(.)\\1{1,}';
// 搜索单词开头的两个或多个相同字符
const result = index.search(query);

准备好开始了吗?

免费下载 GroupDocs.Search 或获取试用许可证以获得完全访问权限!

有用的资源

探索文档,代码样本和社区支持,以增强您的体验。

临时许可提示

1
使用您的工作电子邮件地址进行注册。不允许使用免费邮件服务。
2
使用第二步中的获取临时许可证按钮。
 中国人