In Lucene kann ich Fuzzy-Suche verwenden, um "ähnliche" Ergebnisse zu erhalten.Lucene Fuzzy-Suche auf den gesamten Text
Zum Beispiel Abfrage folgende:
text:awesome~0.8
Werden die Dokumente mit 80% ähnliche Texte, wie 'awesom' gefunden.
Meine Frage ist, kann ich Fuzzy-Suche für den gesamten Text (mehrere Wörter) verwenden?
Zum Beispiel möchte ich folgenden Text 80% Ähnliche Texte, um herauszufinden:
das ist mein Text mit mehreren Worten
Putting Fuzzy-Klausel für jedes Wort würde mich nicht geben gewünscht Ergebnisse:
text:(+this~0.8 +is~0.8 +my~0.8 +text~0.8 +with~0.8 +multiple~0.8 +words~0.8)
Da es nur die Dokumente zurückgeben würde, die alle Wörter (oder 80% ähnliche Worte gegen jedes Wort) in Abfrage angegeben hat.
ich Abfrage erwarten, dass ich zurückkehren führt, wo gesamte String 80% ähnlich ist (auch wenn es nicht ein ganzes Wort hat), zum Beispiel:
dieser Text mit mehreren Wörtern ist
Etwas Ähnliches -
text:(+this +is +my +text +with +multiple +words)~0.8
Offensichtlich obige Abfrage gibt Syntaxfehler, aber ich brauche die Ergebnisse auf gesamten Text/Phrase basiert auf Ähnlichkeit zu erhalten.
Ich bin glücklich, Java-API-Klassen für diesen Zweck zu verwenden, da ich es in einem Java-Programm verwenden muss.