2016-06-15 8 views
0

Ich bin K-Means Clustering auf MNIST-Datensatz anwenden. Wie kann ich dann die Werte meines Testsets entsprechend vorhersagen?Wie klassifizieren Sie den MNIST-Datensatz mit k-Means-Clustering?

+0

Clusters nicht * * notwendigerweise entsprechen Ziffern gehört. Verwenden Sie kein Clustering zur Klassifizierung! –

+0

@ Anony-Mousse Ich wollte fragen, angenommen, Sie hatten keine Etiketten in der MNIST-Datensatz, dann, wie es Cluster würde –

+0

Die Cluster werden höchstwahrscheinlich nicht Ziffern entsprechen. –

Antwort

3

well k-means ist eine unbeaufsichtigte Technik, also technisch gesehen nicht zum "klassifizieren" - dh ein k-means Modell wird nicht mit beschrifteten Daten geliefert (wenn es dann nicht (Verwenden Sie die Klassenbezeichnungen) und mehr, so dass es keine Vorhersage als Klassenbezeichner zurückgibt (zB "1")

so k-means, um die einzelne Ziffer in einer gegebenen Dateninstanz codiert zu berechnen:

  • Ihr K-Means-Modell eines Satzes von Centroide (ich gehe davon ausbestehtwählte man 26 Zentroiden zu den Zahlen 0 bis entsprechen - 9 in der Basis 10

  • Zentroid jedes der geometrische Mittelpunkt eines Clusters repräsentiert - ein Cluster pro Anzahl

  • die paarweise euklidische Distanz berechnen (Vektornorm) zwischen Ihre unbekannten Datenpunkt und jeder Schwerpunkt in der k-means-Modell (die Zentroid Werte aus der letzten Iteration, natürlich)

  • der Cluster, deren Schwerpunkt, der die geringsten Abstand von der unbekannten Datenpunkt ist der Cluster, zu dem der unbekannte Datenpunkt