Ich dachte, das könnte schon mal besprochen worden sein, aber irgendwie konnte ich keine Antworten finden, also hier ist es.Wie interpretiere ich Gensim-Themen richtig?
Im Folgenden sind die Themen mit Gensim lsi aus einer Kundenumfrage generiert. Meine Fragen sind:
- was bedeuten die Minus- und Pluszeichen vor den Wörtern?
- Hier habe ich 5 Themen generiert und ich könnte mehr generiert haben. Wie ermittle ich, wie viele Themen optimal sind? Zum Beispiel, vielleicht statistisch nach dem dritten Thema wird alles andere nur trivial sein.
Alle Vorschläge sind willkommen.
0,527 * "Interesse" + 0,475 * "niedriger" + 0,376 * "Preise" + 0,338 * "Rate" + 0,324 * "gut" + 0,257 * "Service" 0,671 * "gut" + 0,586 * "Service "+ -0.254 *" Zinsen "+ -0.251 *" niedriger "+ -0.159 *" Rate "+ -0.150 *" Preise " 0.600 *" groß "+ 0.351 *" leicht "+ 0.337 *" Belohnungen "+ 0.242 * "verwenden" + -0,167 * "Service" + 0,160 * "wie" -0,503 * "Raten" + 0,499 * "Rate" + -0,39 * "groß" + 0,364 * "hoch" + -0,289 * "niedriger" + 0.167 * "einfach" -0.608 * "groß" + 0.362 * "leicht" + -0.303 * "rate" + 0.275 * "rates" + 0.244 * "verwenden" + -0.227 * "hoch"