Die Frage bezieht sich auf das cluster
Paket. Die Hilfeseite für die von agnes
zurück agnes.object
(Siehe http://stat.ethz.ch/R-manual/R-devel/library/cluster/html/agnes.object.html) besagt, dass dieses Objekt enthält eine order.lab
Komponente „ähnlich wie order
, sondern enthält Beobachtung Etiketten statt Beobachtungszahlen. Diese Komponente ist nur verfügbar, wenn die ursprünglichen Beobachtungen markiert.“
Die Unähnlichkeitsmatrix (twitter.om
in Ihrem Fall), die von TraMineR erzeugt wurde, speichert die Sequenzbezeichnungen derzeit nicht als Zeilen- und Spaltennamen. Um die order.lab
Komponente zu erhalten, müssen Sie die Sequenzbezeichnungen manuell als rownames
und colnames
Ihrer twitter.om
Matrix zuweisen. Ich illustriere hier mit den Daten, die vom TraMineR-Paket zur Verfügung gestellt werden.
library(TraMineR)
data(mvad)
## attaching row labels
rownames(mvad) <- paste("seq",rownames(mvad),sep="")
mvad.seq <- seqdef(mvad[17:86])
## computing the dissimilarity matrix
dist.om <- seqdist(mvad.seq, method = "OM", indel = 1, sm = "TRATE")
## assigning row and column labels
rownames(dist.om) <- rownames(mvad)
colnames(dist.om) <- rownames(mvad)
dist.om[1:6,1:6]
## Hierarchical cluster with agnes library(cluster)
cward <- agnes(dist.om, diss = TRUE, method = "ward")
## here we can see that cward has an order.lab component
attributes(cward)
Das ist für immer order
mit Sequenz Etiketten statt Zahlen. Aber jetzt ist mir nicht klar, welches Clusterergebnis Sie in Text-/Tabellenform haben wollen. Aus dem Dendrogramm entscheiden Sie, wo Sie es schneiden möchten, d. H. Die Anzahl der gewünschten Gruppen und schneiden Sie das Dendrogramm mit cutree
, z. cl.4 <- cutree(clusterward1, k = 4)
. Das Ergebnis cl.4
ist ein Vektor mit der Clusterzugehörigkeit für jede Sequenz und Sie erhalten die Liste der Mitglieder der Gruppe 1, zum Beispiel mit rownames(mvad.seq)[cl.4==1]
.
Alternativ können Sie die identify
-Methode (siehe ?identify.hclust
) verwenden, um die Gruppen interaktiv aus dem Diagramm auszuwählen, aber das Argument als as.hclust(cward)
übergeben. Hier ist der Code für das Beispiel
## plot the dendrogram
plot(cward, which.plot = 2, labels=FALSE)
## and select the groups manually from the plot
x <- identify(as.hclust(cward)) ## Terminate with second mouse button
## number of groups selected
length(x)
## list of members of the first group
x[[1]]
Hope dies hilft.
Vielen Dank! Das ist sehr hilfreich! – histelheim