Ich brauche ein paar Daten gruppieren und ich versuchte kmeans
, pam
und clara
mit R.NA in Clustering-Funktionen (Kmeans, Pam, Clara). Wie verknüpfen Sie Cluster mit Originaldaten?
Das Problem ist, dass meine Daten in einer Spalte eines Datenrahmens sind, und enthält NAs.
Ich habe na.omit()
verwendet, um meine Cluster zu bekommen. Aber wie kann ich sie den Originaldaten zuordnen? Die Funktionen geben einen Vektor von ganzen Zahlen ohne die NAs zurück und sie behalten keine Information über die ursprüngliche Position bei.
Gibt es eine clevere Möglichkeit, die Cluster den ursprünglichen Beobachtungen im Datenrahmen zuzuordnen? (Oder einen Weg, um intelligent Clustering durchzuführen, wenn NAs vorhanden sind?)
Dank
haben Sie Ihre Reihen benannt? Ich denke, Kmeans und Pam (zumindest) behalten die Reihennamen, nicht wahr? – agenis
versucht, aber nein:/ – Bakaburg
Ich mache diesen Weg: kmeans (na.omit (x), k) – Bakaburg