I Porter Stemmer bin mit den Worten Einhalt zu gebieten, und hier ist ein Problem in Ich bin mit:zend lucene Problem mit dem Wort „Hypothek“
Wort „Hypothek“ richtig dämmt „mortgag“ Wort „Hypothekengläubiger“ ist (wohl falsch) dämmt „Hypothek“
Es gibt ungefähr 100 Dokumente mit dem Wort „Hypothek“ Es gibt 1 Dokument mit Wort „Hypothekengläubiger“
Wenn ich einen Index ohne setzen "bauen Hypothekengläubiger "In allen Dokumenten funktioniert alles gut: Suche nach" Hypotheken "oder" Hypotheken "oder" Mor tgag "gibt alle 100 Dokumente zurück.
Wenn ich einen Index erstellen und eines der Dokumente enthält "Hypothekengläubiger", die Suche im Index für "Hypothek" gibt nur ein einziges Dokument mit "Hypothekengläubiger" (was auf "Hypothek" stammte) zurück. Die Suche nach "Hypotheken" oder "Hypotheken" gibt jedoch alle 100 Dokumente zurück.
Die einzige logische Schlussfolgerung, die ich aus diesem Problem ziehen kann, ist, dass Lucene zuerst nach dem Wort mit dem Vorstamm sucht, und wenn es keine Ergebnisse findet, sucht es weiter nach dem Stammwort. So findet man bei der Suche nach "Hypotheken" zuerst die "Hypothek", die vom "Hypothekengläubiger" stammt, und hört auf zu suchen. Ist das das richtige Verhalten oder ist es ein Fehler?