Lassen Sie uns sagen, dass ich einen String-Wert „useridA; useridB, userdidC, useridA, useridA“ bin IndizierungLucene - Erwartetes Verhalten, wenn mehrere Vorkommen eines Tokens innerhalb eines Feldes Indizierung
Das Feld wird auf ANALYZED und Verwendungen ein benutzerdefinierter CharTokenizer, der nach einem Grenzkomma-Zeichen sucht. Was ist das erwartete Verhalten im Index, da das Token "useridA" mehrmals im selben Feld auftritt?
Wird nur derselbe Wert neu indiziert und derselbe Speicherplatz beibehalten, als wäre es nur ein einziger Vorgang gewesen?