2016-05-23 5 views
0

Ich habe 4 verschiedene Datenfelder für verschiedene Städte, aber mit den gleichen Variablen. Ich möchte einen hierarchischen Cluster zwischen dem Dataset der Stadt erstellen. Ich habe diesen Code versucht, eine hierarchische Cluster in R zu machen:Wie wird ein hierarchischer Cluster in R zwischen verschiedenen Datenrahmen erstellt?

hc <- hclust(dist(df)) 
hcd <- as.dendrogram(hc) 

Aber dieser Code macht ein Dendrogramm von einem Datenrahmen. Ich möchte ein Dendrogramm zwischen verschiedenen Städten erstellen, also möchte ich die Reihen zwischen verschiedenen Städten zusammenfassen. Ich habe viel im Internet gesucht, aber ich konnte nichts finden. Weiß jemand, wie man dieses Problem löst?

Ich habe auch versucht, den Datensatz zu kombinieren, aber dann macht es auch Cluster mit der gleichen Stadt. Ich möchte Cluster zwischen verschiedenen Stadt ist

Ein Beispiel für meine Daten-Set machen, wie folgt:

Ich habe 4 verschiedene Datenrahmen von für unterschiedliche Stadt, aber mit den gleichen Variablen. Ich möchte einen hierarchischen Cluster zwischen dem Dataset der Stadt erstellen. Ich habe diesen Code versucht, eine hierarchische Cluster in R zu machen:

hc <- hclust(dist(df)) 
hcd <- as.dendrogram(hc) 

Aber dieser Code macht ein Dendrogramm von einem Datenrahmen. Ich möchte ein Dendrogramm zwischen verschiedenen Städten erstellen, also möchte ich die Reihen zwischen verschiedenen Städten zusammenfassen. Ich habe viel im Internet gesucht, aber ich konnte nichts finden. Weiß jemand, wie man dieses Problem löst?

Ich habe auch versucht, den Datensatz zu kombinieren, aber dann macht es auch Cluster mit der gleichen Stadt. Ich möchte Cluster zwischen verschiedenen Stadt ist

Ein Beispiel für meine Daten-Set machen, wie folgt:

 colname_city col_1 col_2 
[1,] Amsterdam  0.2  0.3 
[2,] Rotterdam  0.3  0.5 
[3,] Den Haag  0.4  0.2 
[4,] Utrecht  0.2  0.1 
[5,] Amsterdam  0.1  0.5 
[6,] Rotterdam  0.2  0.5 
[7,] Rotterdam  0.4  0.4 
[8,] Utrecht  0.5  0.3 
[9,] Utrecht  0.5  0.5 
[10,] Den Haag  0.6  0.3 
+0

Wenn Sie eine Frage stellen, sollten Sie ein Beispiel für reproduzierbare Beispiele (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) mit Beispieleingabedaten bereitstellen wir können eine Vorstellung davon bekommen, was vor sich geht. Warum können Sie Ihre verschiedenen data.frames nicht einfach in einem data.frame zusammenfassen, um das Clustering durchzuführen? – MrFlick

+1

Sie müssen zuerst Datenrahmen zusammenführen und dann hclust –

+0

anwenden Ich habe auch den Datensatz kombiniert. Aber wenn ich ein Cluster daraus mache, dann gruppiert es auch die gleiche Stadt, aber ich möchte verschiedene Städte zusammenfassen. –

Antwort

1

Um jede Stadt separat clustern, eine Teilmenge der Zeilen, die Daten für die jeweilige Stadt enthält, muss ausgewählt werden . Das hierarchische Clustering wird dann nur auf die Teilmenge angewendet. data ist Ihre Beispieltabelle.

city_hc <- function(city){ 
    temp <- data[which(data$colname_city == city),] 
    hcd <- as.dendrogram(hclust(dist(temp))) 
    return(hcd) 
} 

Um Dendrogramme für alle Städte zu erhalten, durchlaufen wir alle Ebenen.

hcds <- lapply(levels(data$colname_city), city_hc) 
names(hcds) <- levels(data$colname_city) 

Das Ergebnis enthält eine Liste aller Dendrogramme.

str(hcds) 
# List of 4 
# $ Amsterdam: ..--[dendrogram w/ 2 branches and 2 members at h = 0.274, midpoint = 0.5] 
# .. |--leaf "1" 
# .. `--leaf "5" 
# $ Den Haag : ..--[dendrogram w/ 2 branches and 2 members at h = 0.274, midpoint = 0.5] 
# .. |--leaf "3" 
# .. `--leaf "10" 
# $ Rotterdam: ..--[dendrogram w/ 2 branches and 3 members at h = 0.274, midpoint = 0.75] 
# .. |--leaf "7" 
# .. `--[dendrogram w/ 2 branches and 2 members at h = 0.122, midpoint = 0.5] 
# .. # |--leaf "2" 
# .. # `--leaf "6" 
# $ Utrecht : ..--[dendrogram w/ 2 branches and 3 members at h = 0.612, midpoint = 0.75] 
# .. |--leaf "4" 
# .. `--[dendrogram w/ 2 branches and 2 members at h = 0.245, midpoint = 0.5] 
# .. # |--leaf "8" 
# .. # `--leaf "9" 

# plot a dendrogram 
plot(hcds[[3]]) 

Ich hoffe, das ist, was Sie tun mussten.