GroupDocs.Search 概要

Java Javaライブラリによる強力なテキスト検索機能。

Illustration search

Javaにおけるインデックス作成と検索操作

GroupDocs.Search for Javaを使用してデータを集め、保存し、効率的に分析し、詳細なインデックスを作成し、より迅速で正確な検索を実現します。

インデックスを統合して検索を最適化

GroupDocs.Search for Javaを使用して、複数のインデックスを簡単に結合し検索を効率化します。小さなデルタインデックスの影響を減らすために、単一の高性能インデックスに統合します。

多言語キーボードレイアウトのサポート

GroupDocs.Search for Javaを使用して異なる言語とキーボードレイアウトにわたる検索を行います。88言語および164のキーボード構成に対応しています。

形態素検索機能

GroupDocs.Search for Javaを使用して、単数/複数名詞や動詞の変化などの異なる単語の形を見つけます。英語や他の言語向けに検索オプションをカスタマイズします。

プラットフォームの独立性

GroupDocs.Search for Javaは主要なオペレーティングシステムとパッケージマネージャーと互換性があります。

Amazon
Docker
Azure
Eclipse
IntelliJ
Windows
Linux
Maven

サポートされるファイル形式

GroupDocs.Search for Javaを使用してさまざまなファイル形式で作業します。完全なリストを表示

一般的なオフィス形式

  • ポータブル: PDF
  • Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM
  • Excel: XLS, XLSX, XLSM, XLT, XLTX, XLTM, XLSB, XLA, XLAM, CSV, TSV
  • PowerPoint: PPT, PPTX, POT, POTX, PPS, PPSX, PPTM, PPSM, POTM
  • OpenDocument: ODT, ODP, ODS, OTT, OTS
  • テキスト: TXT, RTF

メディア形式

  • 一般的な画像形式: BMP, JP2, PNG, EMF, WMF, JPG, PSD
  • マルチページ画像: GIF, WEBP, TIFF
  • オーディオ: MP3, WAV
  • ビデオ: AVI, MOV, QT, FLV, ASF

その他

  • メール: PST, OST, MSG, EML, EMLX
  • Microsoft Visio: VSD, VSS
  • ウェブ: XML, HTM, HTML, XHTML, MHT, MHTML
  • その他: TORRENT, ZIP, DCM, DJVU, EPUB, FB2

GroupDocs.Search for Javaの機能

PDF、DOCX、XLSX、PPTXなどの一般的な形式の高度な検索機能を使用して、ドキュメントコンテンツを効果的に管理します。

Feature icon

カスタマイズ可能な検索パラメータ

検索時に日付範囲や大文字小文字の区別を使用します。

Feature icon

拡張スペルチェック

スペルチェック、ワイルドカード、および特別な文字を無視して効率的に検索します。

Feature icon

検索結果のフィルタリング

検索結果を特定の文書タイプや基準に基づいて焦点を当てます。

Feature icon

インデックスデータのインポートとエクスポート

インデックスデータを簡単にインポートまたはエクスポートします。

Feature icon

不要なファイルをスキップ

特定のファイルや単語を除外してインデックス作成を最適化します。

Feature icon

HTMLおよびURL処理

HTMLコンテンツをファイルに抽出し、検索結果をナビゲートするためのURLを生成します。

Feature icon

大規模インデックスの迅速検索

大規模インデックスを扱いやすいチャンクに分割して、検索操作を迅速にします。

Feature icon

ストリームベースのインデックス作成

ストリームやデータ構造から直接データをインデックス化します。

Feature icon

誤記があるクエリへの対応

誤記を検出し、より良い検索精度のために代替の単語を提案します。

Feature icon

包括的なアーカイブサポート

ネストされたアーカイブをインデックス化し、ZIPファイル内のファイルの詳細リストを取得します。

Feature icon

スペースを節約するインデックス作成

コンパクトなインデックス作成でディスクスペースを節約し、パスワード保護されたファイルを処理します。

Feature icon

カスタム同義語のサポート

精度の向上を目指して同義語辞書を拡張します。

コードサンプル

これらのコードサンプルを使用してGroupDocs.Search for Javaの機能を試してください。

ファジーマッチングで検索精度を向上させる

GroupDocs.Search for Javaの柔軟性を活用して、コンテンツの管理を高度なファジー検索機能で強化します。さらに詳しく

検索結果を処理する方法

// インデックスを作成
Index index = new Index("C:/IndexFolder");
index.add("C:/DocumentFolder");

// 検索オプションを設定
SearchOptions options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3));

// 'water'という単語または'Lorem ipsum'というフレーズを含むドキュメントを検索
String query = "water OR \"Lorem ipsum\"";
SearchResult result = index.search(query, options);

// 検索結果を処理
System.out.println("Documents: " + result.getDocumentCount());
System.out.println("Total occurrences: " + result.getOccurrenceCount());
for (int i = 0; i < result.getDocumentCount(); i++) {
    FoundDocument document = result.getFoundDocument(i);
    System.out.println("Document: " + document.getDocumentInfo().getFilePath());
    System.out.println("Occurrences " + document.getOccurrenceCount());
    }

検索結果を正規表現で絞り込む

GroupDocs.Search for Javaで正規表現を使用して、正確で詳細な検索結果を生成します。 高度なテクニックを見つける

正規表現を使用して検索を行う方法

// インデックスを作成
Index index = new Index("C:/IndexFolder");
index.add("c:/DocumentFolder");

// テキスト形式でフレーズを検索

// 最初のキャレット文字が先頭で、このクエリが正規表現検索であることを示します。
String query = "^^(.)\\1{1,}";
// 単語の先頭に同じ文字が2つ以上存在するか検索
SearchResult result = index.search(query);

始める準備はできていますか?

GroupDocs.Search を無料でダウンロードするか、フルアクセスの試用版ライセンスを取得してください。

有用なリソース

ドキュメント、コードサンプル、コミュニティサポートを調べて、体験を向上させます。

一時ライセンスのヒント

1
職場の電子メールで登録してください。フリー メール サービスは使用できません。
2
2 番目のステップで [一時ライセンスを取得] ボタンを使用します。
 日本