2009-07-21 4 views
6

Ich überlege mir, meiner Solr-Installation semantische Analysen hinzuzufügen, weiß aber nicht genau, wo ich anfangen soll.Semantische Analyse mit Solr

Grundsätzlich möchte ich Solr in der Lage sein, "ähnliche" Wörter (aus dem Körper der indizierten Dokumente) zu finden. Zum Beispiel, wenn ich nach "Musik" suche, sollte ich in der Lage sein, die semantische Engine abzufragen und "Rock", "Pop" usw. zu erhalten (natürlich, wenn diese Wörter in einigen indizierten Dokumenten in der Nähe von Musik erschienen) .

fand ich dieses Projekt, aber ich weiß nicht, ob es der richtige Ort, um zu starten: die Lucene Wordnet contrib package http://code.google.com/p/semanticvectors/

Antwort

4

Semantische Indexierung ist ein guter Anfang. Nach meiner Erfahrung funktionieren diese Technologien in der Praxis jedoch nicht so gut. Sie haben oft sehr bizarre Ergebnisse. Außerdem haben Nutzer aufgrund von Google eine gewisse Erwartung, wie sich die Keyword-Suche verhalten sollte - d. H. Ihr Suchbegriff sollte im passenden Dokument erscheinen.