GroupDocs.Search for Java

Intelligente Textsuche in Dokumenten

Mit GroupDocs.Search for Java können Sie nahtlos Texte aus verschiedenen Dokumenttypen in Ihren Java-Anwendungen durchsuchen und extrahieren.

Durchsuchung von Texten in PDF-Dateien durchführen

GroupDocs.Search ermöglicht es, PDF-Dateien mithilfe komplexer Logik und Indizierung zu durchsuchen, was die Suchgenauigkeit in Java-Anwendungen verbessert.

  1. Richten Sie ein Verzeichnis zur Speicherung des Suchindexes ein.
  2. Wählen Sie einen Ordner mit PDF-Dateien aus.
  3. Definieren Sie zusätzliche Suchoptionen.
  4. Führen Sie die Suche aus und analysieren Sie die Ergebnisse.
// Verzeichnis für die Speicherung des Suchindex festlegen
Index index = new Index("c:/MyIndex");

// Ordner angeben, der durchsuchbare Dokumente enthält
index.add("c:/MyDocuments");

// Homophon-Suche aktivieren, um Wörter mit ähnlicher Aussprache zu erfassen
SearchOptions options = new SearchOptions();
options.setUseHomophoneSearch(true);

// Führen Sie eine erweiterte Suchanfrage aus
SearchResult result = index.search("metis", options);
Maven XML
Klicken, um zu kopieren
kopiert
Weitere Beispiele Dokumentation

Erweiterte Such- und Indizierungsfunktionen

GroupDocs.Search for Java vereinfacht die Textsuche und Indizierung in über 70 Dokumentformaten und bietet effiziente Werkzeuge, um Informationen schnell zu verwalten und abzurufen.

Kernfunktionen von GroupDocs.Search

Umfassende Textsuche

Finden Sie Texte in mehreren Dokumentformaten wie PDFs, Word-Dokumenten, PowerPoint-Präsentationen und Tabellen. Nutzen Sie exakte Übereinstimmungen, unscharfe Suche und Wildcard-Operatoren für verfeinerte Suchergebnisse.

Optimierte Indizierung für große Datenmengen

Erstellen Sie strukturierte Indizes, um Suchvorgänge zu beschleunigen und effizient durch umfangreiche Dokumentenbestände zu navigieren.

Unterstützt mehrere Sprachen

Führen Sie Suchen in über 80 Sprachen durch, mit integrierter Unterstützung für unterschiedliche Tastaturlayouts und Wortmorphologievariationen, um die Genauigkeit zu erhöhen.

Flexible Suchoptionen

Passen Sie Suchen mit Optionen wie Groß- und Kleinschreibung, datumsbasiertem Filtern und der Möglichkeit, spezifische Wörter auszuschließen, für präzise Ergebnisse an.

Implementierung fortgeschrittener Suchabfragen

Dieses Beispiel zeigt, wie man Suchabfragen verwendet, um effizient in PDF-Daten zu suchen.

Java

// Verzeichnis für die Suchindizierung festlegen
Index index = new Index("c:/MyIndex");
    
// Dateipfad für die Dokumente angeben
index.add("c:/MyDocuments");

// Passwort für verschlüsselte Dokumente eingeben
index.getDictionaries().getDocumentPasswords().add("protected.pdf", "123456");

// Unscharfe Suche aktivieren, um ähnliche Wörter zu erkennen
SearchOptions options = new SearchOptions();
options.getFuzzySearch().setEnabled(true);
options.getFuzzySearch().setFuzzyAlgorithm(new SimilarityLevel(0.8));

// Suchergebnisse abrufen
SearchResult result = index.Search("Loarem", options);

// Suchergebnisse verarbeiten und analysieren
System.out.println("Documents: " + result.getDocumentCount());
System.out.println("Occurrences: " + result.getDocumentCount());
Maven XML
Klicken, um zu kopieren
kopiert
Weitere Beispiele Dokumentation

Was macht GroupDocs.Search?

GroupDocs.Search for Java ist eine leistungsstarke Bibliothek zur Dokumentensuche und -indizierung, die über 70 Dateiformate unterstützt, darunter PDF, Word, PowerPoint, Excel, Bilder und ZIP-Archive. Sie ermöglicht schnelle, präzise und skalierbare Suchfunktionen für große Dokumentensammlungen.
Mehr Erfahren
About illustration

Bereit, loszulegen?

Laden Sie GroupDocs.Search kostenlos herunter oder holen Sie sich eine Testlizenz für vollen Zugriff!

Nützliche Ressourcen

Erforschen Sie die Dokumentation, Code -Beispiele und die Unterstützung der Community, um Ihre Erfahrungen zu verbessern.

Überblick über die Hauptfunktionen

Entdecken Sie leistungsstarke Textsuchfunktionen, die für Effizienz und Präzision entwickelt wurden.

Informationen in PDF-Dokumenten mit GroupDocs.Search finden

GroupDocs.Search unterstützt über 70 Formate, einschließlich Office-Dateien, und ermöglicht schnelle Suchen mit fortschrittlichen Indizierungsfunktionen.

Tipps zur temporären Lizenz

1
Melden Sie sich mit Ihrer geschäftlichen E-Mail-Adresse an. Kostenlose E-Mail-Dienste sind nicht zulässig.
2
Klicken Sie im zweiten Schritt auf die Schaltfläche Provisorische Lizenz anfordern.
 Deutsch