Die Frage ist eine Frage, die zuerst kommen sollte: a) die Clusterbildung oder b) die Dimensionalitätsreduktion Algorithmus? Mit anderen Worten, kann ich eine Pseudo (wie es ist nicht wirklich) Dimensionalität Reduktionsmethode wie t-SNE und dann einen Clustering-Algorithmus verwenden, um Cluster zu extrahieren oder sollte die Clustering auf dem ursprünglichen hochdimensionalen Raum durchgeführt werden und verwendet werden nur die Knoten färben? Ist der folgende Code ein guter Start, oder irre ich mich vollständig?Perform Clustering mit t-SNE Dimensionalitätsreduktion
adjMat = g.get_adjacency(attribute='weight') #get the adjacency matrix from a really large graph
adjMat = np.array(adjMat.data)
adjMat = adjMat.T #use the incoming interaction vectors
#initiate the t-SNE algorithm
tsne = manifold.TSNE() #set dimensionality reduction algorithm
manifoldCoords = tsne.fit_transform(adjMat)
#initiate clustering algorithm
clusteralgorithm = clusterAlgs.KMeans() #set clustering algorithm
linear_clusters = clusteralgorithm.fit_predict(manifoldCoords) #extract clusters