Ich interessiere mich für Kmeans Clustering auf einer Liste von Wörtern mit dem Abstand messen ist Leveshtein.Python KMeans Clustering Worte
1) Ich weiß, dass es viele Frameworks gibt, einschließlich scipy und orange, die eine kmeans Implementierung hat. Allerdings benötigen sie alle eine Art Vektor als die Daten, die mir nicht wirklich passen.
2) Ich brauche eine gute Cluster-Implementierung. Ich schaute auf Python-Clustering und erkannte, dass es nicht a) die Summe aller Entfernungen zu jedem Schwerpunkt zurückgibt, und b) es keine Art von Iterationslimit oder Cut-off hat, was die Qualität des Clusterings sicherstellt. python-clustering und der Clustering-Algorithmus auf daniweb funktionieren nicht wirklich für mich.
Kann mir jemand eine gute lib finden? Google war nicht mein Freund
Ich würde genau das Gleiche brauchen. Hast du seitdem etwas gefunden? – Jabba