Tổng quan về GroupDocs.Search

Khám phá khả năng tìm kiếm văn bản mạnh mẽ của thư viện Java Java.

Illustration search

Tính năng Lập chỉ mục và Tìm kiếm trong Java

Với GroupDocs.Search for Java, bạn có thể thu thập, lưu trữ và phân tích dữ liệu hiệu quả để tạo các chỉ mục chi tiết cho các tìm kiếm nhanh hơn, chính xác hơn.

Tối ưu hóa tìm kiếm bằng cách kết hợp các chỉ mục

Dễ dàng kết hợp nhiều chỉ mục với GroupDocs.Search for Java để tối ưu hóa việc tìm kiếm. Giảm ảnh hưởng của các chỉ mục delta nhỏ hơn bằng cách hợp nhất chúng thành một chỉ mục hiệu suất cao.

Hỗ trợ cho các bố cục bàn phím đa ngôn ngữ

Tìm kiếm qua các ngôn ngữ và bố cục bàn phím khác nhau với GroupDocs.Search for Java. Nó hỗ trợ 88 ngôn ngữ và 164 cấu hình bàn phím cho tính linh hoạt vượt trội.

Khả năng tìm kiếm dạng hình thái

Tìm các dạng từ khác nhau như danh từ số ít/số nhiều hoặc biến thể động từ bằng cách sử dụng GroupDocs.Search for Java. Tùy chỉnh các tùy chọn tìm kiếm cho tiếng Anh và các ngôn ngữ khác.

Khả năng độc lập của nền tảng

GroupDocs.Search for Java tương thích với các hệ điều hành chính và trình quản lý gói.

Amazon
Docker
Azure
Eclipse
IntelliJ
Windows
Linux
Maven

Các định dạng tệp được hỗ trợ

Làm việc với một loạt các định dạng tệp bằng GroupDocs.Search for Java. Xem danh sách đầy đủ.

Các định dạng văn phòng phổ biến

  • Portable: PDF
  • Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM
  • Excel: XLS, XLSX, XLSM, XLT, XLTX, XLTM, XLSB, XLA, XLAM, CSV, TSV
  • PowerPoint: PPT, PPTX, POT, POTX, PPS, PPSX, PPTM, PPSM, POTM
  • OpenDocument: ODT, ODP, ODS, OTT, OTS
  • Văn bản: TXT, RTF

Các định dạng đa phương tiện

  • Các định dạng hình ảnh phổ biến: BMP, JP2, PNG, EMF, WMF, JPG, PSD
  • Hình ảnh nhiều trang: GIF, WEBP, TIFF
  • Âm thanh: MP3, WAV
  • Video: AVI, MOV, QT, FLV, ASF

Khác

  • Email: PST, OST, MSG, EML, EMLX
  • Microsoft Visio: VSD, VSS
  • Web: XML, HTM, HTML, XHTML, MHT, MHTML
  • Khác: TORRENT, ZIP, DCM, DJVU, EPUB, FB2

Các tính năng của GroupDocs.Search for Java

Quản lý nội dung tài liệu một cách hiệu quả với các khả năng tìm kiếm nâng cao hỗ trợ các định dạng như PDF, DOCX, XLSX, PPTX, và nhiều hơn nữa.

Feature icon

Tham số tìm kiếm có thể tùy chỉnh

Tinh chỉnh tìm kiếm bằng cách sử dụng bộ lọc phạm vi ngày và tính nhạy cảm với chữ hoa.

Feature icon

Kiểm tra chính tả nâng cao

Tìm kiếm hiệu quả với kiểm tra chính tả, các ký hiệu thay thế, và bỏ qua các ký tự đặc biệt.

Feature icon

Kết quả tìm kiếm đã lọc

Áp dụng bộ lọc để tập trung vào kết quả tìm kiếm dựa trên các loại tài liệu hoặc tiêu chí cụ thể.

Feature icon

Nhập và Xuất dữ liệu chỉ mục

Dễ dàng nhập dữ liệu để lập chỉ mục hoặc xuất các kết quả vào tệp để sử dụng sau.

Feature icon

Bỏ qua các tệp không cần thiết

Tối ưu hóa lập chỉ mục bằng cách loại trừ các tệp hoặc từ cụ thể.

Feature icon

Xử lý HTML và URL

Trích xuất nội dung HTML thành các tệp và tạo liên kết để điều hướng qua các kết quả tìm kiếm.

Feature icon

Tìm kiếm nhanh trong các chỉ mục lớn

Tăng tốc các hoạt động tìm kiếm bằng cách chia nhỏ các chỉ mục lớn thành các phần có thể quản lý.

Feature icon

Lập chỉ mục từ dòng

Lập chỉ mục trực tiếp dữ liệu từ các dòng hoặc cấu trúc dữ liệu.

Feature icon

Xử lý các truy vấn viết sai

Phát hiện lỗi chính tả và gợi ý các từ thay thế để cải thiện độ chính xác trong tìm kiếm.

Feature icon

Hỗ trợ lưu trữ toàn diện

Lập chỉ mục các lưu trữ lồng vào trong và truy xuất danh sách chi tiết các tệp bên trong các tệp ZIP.

Feature icon

Lập chỉ mục tiết kiệm không gian

Lập chỉ mục gọn gàng để tiết kiệm không gian ổ đĩa và xử lý các tệp được bảo vệ bằng mật khẩu.

Feature icon

Hỗ trợ từ đồng nghĩa tùy chỉnh

Mở rộng từ điển đồng nghĩa để nâng cao độ chính xác trong tìm kiếm với các tùy chọn được tùy chỉnh.

Mẫu mã

Thử nghiệm các tính năng của GroupDocs.Search for Java với những ví dụ mã này.

Tăng độ chính xác tìm kiếm với Tìm kiếm Mờ

Khám phá tính linh hoạt của GroupDocs.Search for Java để quản lý nội dung với khả năng tìm kiếm mờ nâng cao. Tìm hiểu thêm.

Cách xử lý kết quả tìm kiếm

// Tạo một chỉ mục
Index index = new Index("C:/IndexFolder");
index.add("C:/DocumentFolder");

// Thiết lập tùy chọn tìm kiếm
SearchOptions options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3));

// Tìm kiếm các tài liệu chứa từ 'nước' hoặc cụm từ 'Lorem ipsum'
String query = "water OR \"Lorem ipsum\"";
SearchResult result = index.search(query, options);

// Xử lý kết quả tìm kiếm
System.out.println("Documents: " + result.getDocumentCount());
System.out.println("Total occurrences: " + result.getOccurrenceCount());
for (int i = 0; i < result.getDocumentCount(); i++) {
    FoundDocument document = result.getFoundDocument(i);
    System.out.println("Document: " + document.getDocumentInfo().getFilePath());
    System.out.println("Occurrences " + document.getOccurrenceCount());
    }

Tinh chỉnh kết quả với Biểu thức chính quy

Sử dụng biểu thức chính quy trong GroupDocs.Search for Java để tạo kết quả tìm kiếm chính xác và chi tiết. Khám phá các kỹ thuật nâng cao.

Cách tìm kiếm bằng biểu thức chính quy

// Tạo một chỉ mục
Index index = new Index("C:/IndexFolder");
index.add("c:/DocumentFolder");

// Tìm kiếm cụm từ ở dạng văn bản

// Ký tự caret đầu tiên ở đầu chỉ ra rằng đây là truy vấn tìm kiếm bằng biểu thức chính quy
String query = "^^(.)\\1{1,}";
// Tìm kiếm hai hoặc nhiều ký tự giống nhau ở đầu một từ
SearchResult result = index.search(query);

Sẵn sàng để bắt đầu?

Tải xuống GroupDocs.Search miễn phí hoặc nhận giấy phép dùng thử để có toàn quyền truy cập!

Tài nguyên hữu ích

Khám phá tài liệu, mẫu mã và hỗ trợ cộng đồng để nâng cao trải nghiệm của bạn.

Lời khuyên về giấy phép tạm thời

1
Đăng ký bằng email công việc của bạn. Dịch vụ thư miễn phí không được phép.
2
Sử dụng nút Nhận giấy phép tạm thời ở Bước thứ hai.
 Tiếng Việt