GroupDocs.Search の概要

テキスト検索用の Node.js JavaScript ライブラリ

Illustration search

Node.js インデックス作成と検索操作

GroupDocs.Search for Node.js via Java のインデックス作成により、データが収集、保存、解析され、正確かつ効率的な検索操作が可能になります。これらのインデックスは、検索を実行するために頻繁に使用されます。

複数のインデックスを結合して検索効率を向上

GroupDocs.Search for Node.js via Java API を使用すると、複数のインデックスを 1 つに結合できます。頻繁に変更を行うと複数の差分インデックスが作成され、検索パフォーマンスが低下する可能性があります。当社のソリューションは、これらのデルタ インデックスを、マージされたデルタ インデックスからのすべての情報を含む共通インデックスにマージし、デルタ インデックスを変更せずに検索効率を大幅に向上させます。このプロセスを微調整するためにさまざまな機能を構成できます。

さまざまなキーボード レイアウトからの検索クエリを認識する

GroupDocs.Search for Node.js via Java は、キーボード レイアウトと一致しない検索クエリを認識します。現在、88 の言語と 164 の異なるキーボード レイアウトがサポートされています。

形態学的単語形式を使用した検索

GroupDocs.Search for Node.js via Java を使用すると、名詞の単数形や複数形、動詞のすべての形など、さまざまな語形を検索できます。英語および英語以外の言語は、特定の語形に合わせてカスタマイズできます。

プラットフォームの独立性

GroupDocs.Search for Node.js via Java は、すべての一般的なオペレーティング システムとパッケージ マネージャーをサポートしています。

Windows
macOS
Linux
NPM
NuGet
Amazon
Docker
Azure
VS Code
Eclipse
IntelliJ

サポートされているファイル形式

GroupDocs.Search for Node.js via Java を使用すると、幅広いファイル形式を処理できます。 完全なリストを確認

一般的な Office フォーマット

  • ポータブル: PDF
  • Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM
  • Excel: XLS, XLSX, XLSM, XLT, XLTX, XLTM, XLSB, XLA, XLAM, CSV, TSV
  • PowerPoint: PPT, PPTX, POT, POTX, PPS, PPSX, PPTM, PPSM, POTM
  • OpenDocument: ODT, ODP, ODS, OTT, OTS
  • 文章: TXT, RTF

メディアフォーマット

  • 一般的な画像形式: BMP, JP2, PNG, EMF, WMF, JPG, PSD
  • 複数ページの画像: GIF, WEBP, TIFF
  • オーディオ: MP3, WAV
  • ビデオ: AVI, MOV, QT, FLV, ASF

他の

  • Eメール: PST, OST, MSG, EML, EMLX
  • Microsoft Visio: VSD, VSS
  • ウェブ: XML, HTM, HTML, XHTML, MHT, MHTML
  • その他: TORRENT, ZIP, DCM, DJVU, EPUB, FB2

GroupDocs.Search for Node.js via Java の機能

PDF、DOCX、XLSX、PPTX などの一般的なファイル形式をサポートする高度な検索エンジンを使用してビジネス ドキュメントのコンテンツを管理します。

Feature icon

柔軟なパラメータ

検索パラメータとして日付範囲と大文字と小文字の区別を使用する

Feature icon

スペルチェック検索

スペルチェックとワイルドカードを含む検索フレーズを使用し、クエリ内の特殊文字をスキップする

Feature icon

結果のフィルタリング

検索結果でのドキュメント フィルタリングの設定

Feature icon

インポート・エクスポート

インデックス作成およびファイルへのエクスポート中にインポートを実行するかリストを使用して文字を変更する

Feature icon

不要なデータをスキップする

特定のファイルのインデックス作成を選択的にスキップし、特定の単語をスキップしてインデックスを高速化します

Feature icon

URL処理

HTML 形式のテキストをファイルに抽出し、HTML で検索結果をナビゲートするための URL を生成します

Feature icon

迅速な検索

検索をより小さなチャンクに分割して、大規模なインデックスを迅速に検索する

Feature icon

ストリーム処理

ストリームとデータ構造からドキュメントにインデックスを付ける

Feature icon

スペルミスの処理

見つかった各単語の正確な出現数を有効にして、スペルミスの場合に代替単語の提案を提供します

Feature icon

アーカイブサポート

他の ZIP アーカイブ内の ZIP アーカイブにインデックスを付け、アーカイブ内のインデックス付きファイルのリストを取得する

Feature icon

ディスク容量の節約

コンパクトなインデックス作成とパスワードで保護されたドキュメントのインデックス作成でスペースを節約

Feature icon

カスタム同義語

英語の同義語をデフォルトの同義語辞書に追加

コードサンプル

例を使用して GroupDocs.Search for Node.js via Java の機能を探索する

あいまい検索を使用して生産性を向上させる

柔軟な GroupDocs.Search for Node.js via Java 機能を利用して、洗練された検索アルゴリズムによってドキュメント コンテンツの制御を強化します。 詳細

検索結果の処理方法

// インデックスを作成する
const index = new Index('c:/IndexFolder');
index.add('c:/DocumentFolder');

// 検索オプションを設定する
var options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3));

// 「water」という単語または「Lorem ipsum」という語句を含むドキュメントを検索する
var query = "water OR \"Lorem ipsum\"";
var result = index.search(query, options);

// プロセス検索結果
console.log("Documents: " + result.getDocumentCount());
console.log("Total occurrences: " + result.getOccurrenceCount());
for (int i = 0; i < result.getDocumentCount(); i++) {
    FoundDocument document = result.getFoundDocument(i);
    console.log('Document: ${document.getDocumentInfo().getFilePath()}');
    console.log('Occurrences: ${document.getOccurrenceCount()}');
    }

正規表現は高度な検索シナリオで使用できます

GroupDocs.Search for Node.js via Java では、正規表現を使用して検索結果を絞り込むことができます。 高度な検索テクニックを詳しく見る

正規表現を使って検索する方法

// インデックスを作成する
const index = new Index('c:/IndexFolder');
index.add('c:/DocumentFolder');

// テキスト形式で語句を検索します

// 先頭の最初のキャレット文字は、これが正規表現検索クエリであることを示します
var query = "^^(.)\\1{1,}";
// 単語の先頭にある 2 つ以上の同一の文字を検索します
var result = index.search(query);
 日本