Was ist der beste Weg, um Synonyme (Phrasen) mit Lucene zu behandeln? Insbesondere, wenn ich Abfragen wie ausführen müssen: a OR b OR c NICHT dSynonyme mit Lucene
Wie wäre es mit dem Hinzufügen eines neuen Feldes namens "Synonyme" zu jedem Dokument beim Indexieren? Der Wert dieses Felds würde eine Liste aller Synonyme enthalten. Es würde nur zu einem Dokument hinzugefügt, wenn dieses Dokument eines der Synonyme hat.
dann würde ich ausführen eine „OR“ Abfrage suchen, die zusammen mit anderen Bereichen für den Suchbegriff in diesem Bereich aussehen würden.
Kann dieser Ansatz für jede Art von Abfrage gut funktionieren?
FYI, Die Synonyme in meiner Anwendung sind völlig individuelle und nicht von Englisch-Wörterbuch ... dh. "Global Leader in Finance" könnte auch bedeuten, "Top Investment Bank" oder "Fortune-500-Finance Firma" etc etc.
Bitte vorschlagen.
Danke.
Danke für deine Eingaben Adam ... Könntest du bitte nochmal auf meine Frage verweisen? Ich habe sie jetzt bearbeitet. –
Das WordNet-Modul erstellt einen Lucene-Index, genau wie Sie. Dieser Index, den er erstellt, wird schließlich zum Erweitern von Abfragen verwendet. Wenn Sie einfach versucht haben, diesen Index aus dem Wörterbuch von WordNet zu erstellen, können Sie sicher sagen, welche Feldnamen er für seinen Index verwendet, und Sie können selbst eigene Einträge hinzufügen. –