Der aktuelle Mahout 0.8-SNAPSHOT enthält eine Collapsed Variationale Bayes (cvb) Version für Topic Modeling und entfernt den Latent Dirichlet Analysis (lda) -Ansatz, weil cvb viel besser parallelisiert werden kann. Leider gibt es nur Dokumentation für lda, wie man ein Beispiel ausführt und eine sinnvolle Ausgabe erzeugt.Run cvb in Mahout 0.8
So, ich will:
- Vorprozess einige Texte richtig
- die cvb0_local Version von cvb laufen
- inspizieren die Ergebnisse von in jedem der generierten Themen in den oberen n Wörter suchen
gibt es eine Möglichkeit eache Themen Documen retrive ts? oder umgekehrt, Dokumenten-Themen zu reaktivieren? –