Обзор GroupDocs.Search

Откройте для себя мощные возможности текстового поиска библиотеки Java Java.

Illustration search

Индексирование и операции поиска в Java

С GroupDocs.Search for Java вы можете эффективно собирать, хранить и анализировать данные, создавая детализированные индексы для более быстрых и точных поисков.

Оптимизация поиска путем объединения индексов

Легко объединяйте несколько индексов с помощью GroupDocs.Search for Java для оптимизации поиска. Уменьшите влияние небольших дельта-индексов, консолидировав их в один высокопроизводительный индекс.

Поддержка многоязычных раскладок клавиатуры

Ищите на разных языках и раскладках клавиатуры с GroupDocs.Search for Java. Он поддерживает 88 языков и 164 конфигурации клавиатуры для непревзойденной универсальности.

Морфологические возможности поиска

Находите различные формы слов, такие как единственное и множественное число существительных или варианты глаголов с помощью GroupDocs.Search for Java. Настройте параметры поиска для английского и других языков.

Независимость от платформы

GroupDocs.Search for Java совместим с основными операционными системами и менеджерами пакетов.

Amazon
Docker
Azure
Eclipse
IntelliJ
Windows
Linux
Maven

Поддерживаемые форматы файлов

Работайте с широким спектром форматов файлов с помощью GroupDocs.Search for Java. Смотрите полный список.

Популярные офисные форматы

  • Портативный: PDF
  • Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM
  • Excel: XLS, XLSX, XLSM, XLT, XLTX, XLTM, XLSB, XLA, XLAM, CSV, TSV
  • PowerPoint: PPT, PPTX, POT, POTX, PPS, PPSX, PPTM, PPSM, POTM
  • OpenDocument: ODT, ODP, ODS, OTT, OTS
  • Текст: TXT, RTF

Медийные форматы

  • Популярные форматы изображений: BMP, JP2, PNG, EMF, WMF, JPG, PSD
  • Многостраничные изображения: GIF, WEBP, TIFF
  • Аудио: MP3, WAV
  • Видео: AVI, MOV, QT, FLV, ASF

Другие

  • Электронная почта: PST, OST, MSG, EML, EMLX
  • Microsoft Visio: VSD, VSS
  • Веб: XML, HTM, HTML, XHTML, MHT, MHTML
  • Другие: TORRENT, ZIP, DCM, DJVU, EPUB, FB2

Функции GroupDocs.Search for Java

Эффективно управляйте содержимым документов с помощью расширенных возможностей поиска, поддерживающих форматы, такие как PDF, DOCX, XLSX, PPTX и другие.

Feature icon

Настраиваемые параметры поиска

Уточняйте поиск с использованием фильтров по диапазону дат и чувствительности к регистру.

Feature icon

Усиленная проверка правописания

Эффективно ищите с исправлением правописания, подстановочными знаками и игнорированием специальных символов.

Feature icon

Фильтрация результатов поиска

Применяйте фильтры для уточнения результатов поиска по типам документов или критериям.

Feature icon

Импорт и экспорт данных индекса

Легко импортируйте данные для индексирования или экспортируйте результаты в файлы для дальнейшего использования.

Feature icon

Пропуск ненужных файлов

Оптимизируйте индексирование, исключая определенные файлы или слова.

Feature icon

Обработка HTML и URL

Извлекайте содержимое HTML в файлы и генерируйте URL для навигации по результатам поиска.

Feature icon

Быстрый поиск в больших индексах

Ускорьте операции поиска, разделяя большие индексы на управляемые части.

Feature icon

Индексирование на основе потоков

Индексируйте данные непосредственно из потоков или структур данных.

Feature icon

Обработка ошибочных запросов

Обнаруживайте опечатки и предлагайте альтернативные слова для повышения точности поиска.

Feature icon

Полноценная поддержка архивов

Индексируйте вложенные архивы и извлекайте детализированные списки файлов внутри ZIP-файлов.

Feature icon

Компактное индексирование

Экономьте место на диске с помощью компактного индексирования и обрабатывайте зашифрованные файлы.

Feature icon

Поддержка временных синонимов

Расширяйте словарь синонимов для повышения точности поиска с использованием адаптированных опций.

Примеры кода

Попробуйте функции GroupDocs.Search for Java с помощью этих примеров кода.

Повышение точности поиска с помощью нечеткого соответствия

Изучите возможности GroupDocs.Search for Java для управления содержимым с помощью передовых возможностей нечеткого поиска. Узнайте больше.

Как обработать результат поиска

// Создайте индекс
Index index = new Index("C:/IndexFolder");
index.add("C:/DocumentFolder");

// Настройте параметры поиска
SearchOptions options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3));

// Ищите документы, содержащие слово 'вода' или фразу 'Lorem ipsum'
String query = "water OR \"Lorem ipsum\"";
SearchResult result = index.search(query, options);

// Обработайте результат поиска
System.out.println("Documents: " + result.getDocumentCount());
System.out.println("Total occurrences: " + result.getOccurrenceCount());
for (int i = 0; i < result.getDocumentCount(); i++) {
    FoundDocument document = result.getFoundDocument(i);
    System.out.println("Document: " + document.getDocumentInfo().getFilePath());
    System.out.println("Occurrences " + document.getOccurrenceCount());
    }

Уточнение результатов с помощью регулярных выражений

Используйте регулярные выражения в GroupDocs.Search for Java для создания точных и детализированных результатов поиска. Узнайте о передовых методах.

Как искать с использованием регулярных выражений

// Создайте индекс
Index index = new Index("C:/IndexFolder");
index.add("c:/DocumentFolder");

// Ищите фразу в текстовом формате

// Первый символ ^ в начале указывает, что это поисковый запрос с использованием регулярного выражения
String query = "^^(.)\\1{1,}";
// Ищите два или более одинаковых символа в начале слова
SearchResult result = index.search(query);

Готовы начать?

Загрузите GroupDocs.Search бесплатно или получите пробную лицензию для полного доступа!

Полезные ресурсы

Изучите документацию, примеры кода и раздел поддержки, чтобы улучшить ваш опыт.

Советы по временной лицензии

1
Зарегистрируйтесь, используя ваш рабочий e-mail адрес. Бесплатные почтовые сервисы запрещены.
2
Используйте кнопку Получить временную лицензию на втором шаге.
 Русский