2016-07-16 6 views
1

Ich versuche Spectral Clustering auf Glas-Datensatz aus UCI-Repository. Wenn Sie Glass Daten wissen hat 9 Attribute "RI", "Na", "Mg", "Al", "Si", "K", "Ca", "Ba" und "Fe". Ich verwende "kknn" Paket, das spektrale Clustering "specClust" hat, wie folgende Ergebnisse zu erzielen:R - Spektralclustering für Glasdaten

library(kknn) 
data(glass) 
specClust(glass[, 1:9], centers=2, nn=50, iter.max=30) 

jedoch in Folge, ich bin immer Cluster bedeutet für 2 Attribute, wie folgend:

 [,1]  [,2] 
1 0.9096567 -0.3331058 
2 0.5101274 0.8273862 

es soll sollten Cluster bedeutet für alle 9 Attribute nicht nur für die 2. zurückzukehren, wenn ich laufe K-Means-Clustering, R Konsole kehrt Cluster bedeutet für 9 Attribute, wie folgend:

 RI  Na  Mg  Al  Si   K  Ca  Ba 
1 1.519226 13.7124 0.210400 1.837800 72.87120 0.4910000 10.160400 0.56580000 
2 1.518103 13.3150 3.438841 1.325122 72.58378 0.4989024 8.590061 0.05591463 
     Fe 
1 0.0480000 
2 0.0597561 

Ich würde gerne wissen, warum Spectral Clustering in "kknn" Paket Cluster-Mittel für nur 2 Attribute bedeutet. Ich habe versucht, den Grund zu finden, war aber nicht erfolgreich.

Ich werde alle Hilfe zu schätzen wissen. Vielen Dank im Voraus für die Hilfe.

Antwort

3

Sie haben sich die Statistiken für die 2 Cluster insgesamt angesehen.

Dies sollte Sie geben, was Sie für mehr suchen:

pacman::p_load(kknn) 
data(glass) 
cl <- specClust(glass[, 1:9], centers=2, nn=50, iter.max=30) 
pcol <- as.character(glass$Type) 
pairs(glass[2:10], pch = pcol, col = c("green", "red")[cl$cluster]) 
table(glass$Type, cl$cluster) 

aggregate(glass[,2:10],by=list(cl$cluster),mean) 
Group.1  RI  Na  Mg  Al  Si   K  Ca   Ba   Fe 
1  1 1.519061 13.81638 0.9115942 1.746232 72.6613 0.4652174 9.729130 0.534202899 0.04318841 
2  2 1.518035 13.21345 3.5282069 1.301517 72.6460 0.5122069 8.589517 0.004137931 0.06358621 

enter image description here