2016-04-25 13 views
-1

Ich habe einen R-Datenrahmen, der den Quellknoten, den Zielknoten und den Abstand zwischen ihnen enthält. Hier ist ein Teil des Datenrahmen:KBeans Clustering von Knoten (Daten in Form von R-Datenframe: Quelle, Ziel und Entfernung) in Cluster gleicher Größe

source, destination, distance

Ich mag die Knoten in Gruppen fester Größe clustern (etwa 8). Wie implementiere ich das in R?

EDIT 1: Wie bereits erwähnt, ist Kmeans hier nicht anwendbar. Es gibt einen anderen Cluster-Algorithmus, der k-medoids/pam

Hier sind einige andere Links funktionieren könnte, die interessant sein könnte:

1) Link1

2) Link2

+0

Was hast du probiert? Bitte geben Sie weitere Informationen an, einschließlich Methoden, die Sie versucht haben, sowie ein Dataset, das im Textformat und nicht als Bild vorliegt. Siehe das folgende Beispiel zum Erstellen eines [minimalen Beispiels] (http://stackoverflow.com/help/mcve) – lmo

+1

Kmeans minimiert den Abstand von den Kmeans-Zentren und den einzelnen Datenelementen. Der Prozess ist iterativ mit dem Ort der Kmeans-Zentren. Kmeans ist möglicherweise nicht die beste Methode zum Clustering in dieser Anwendung, da die oben angegebenen Daten auf einen gerichteten Graphen und nicht auf einen Koordinatensatz verweisen. – Dave2e

+0

Wie Dave2e sagt, sieht das wie ein gerichteter Graph aus. Haben Sie etwas wie Gephi untersucht, das darüber Clustering anwenden kann? – Zfunk

Antwort

1

K-Means kann nur verwendet werden auf Koordinaten.

Es ist bedeutet. Sie können den Mittelwert nur für Koordinaten berechnen. Sie müssen einen anderen Algorithmus wählen.

+0

Vielen Dank für die Korrektur. Könnten Sie bitte einen Algorithmus vorschlagen, der für diesen Datensatz gleich große Cluster bereitstellt? – Lawrence

+0

k-means gibt auch keine gleich großen Cluster ... Sie müssen sich darüber im Klaren sein, was Sie für ein gutes Ergebnis halten, bevor Sie einen Algorithmus auswählen können. Sie können natürlich hierarchisches Clustering oder PAM durchführen. Aber ob sie gut sind, hängt von deinem Problem ab. –