Ich bin K-Means Clustering auf MNIST-Datensatz anwenden. Wie kann ich dann die Werte meines Testsets entsprechend vorhersagen?Wie klassifizieren Sie den MNIST-Datensatz mit k-Means-Clustering?
Antwort
well k-means ist eine unbeaufsichtigte Technik, also technisch gesehen nicht zum "klassifizieren" - dh ein k-means Modell wird nicht mit beschrifteten Daten geliefert (wenn es dann nicht (Verwenden Sie die Klassenbezeichnungen) und mehr, so dass es keine Vorhersage als Klassenbezeichner zurückgibt (zB "1")
so k-means, um die einzelne Ziffer in einer gegebenen Dateninstanz codiert zu berechnen:
Ihr K-Means-Modell eines Satzes von Centroide (ich gehe davon ausbestehtwählte man 26 Zentroiden zu den Zahlen 0 bis entsprechen - 9 in der Basis 10
Zentroid jedes der geometrische Mittelpunkt eines Clusters repräsentiert - ein Cluster pro Anzahl
die paarweise euklidische Distanz berechnen (Vektornorm) zwischen Ihre unbekannten Datenpunkt und jeder Schwerpunkt in der k-means-Modell (die Zentroid Werte aus der letzten Iteration, natürlich)
der Cluster, deren Schwerpunkt, der die geringsten Abstand von der unbekannten Datenpunkt ist der Cluster, zu dem der unbekannte Datenpunkt
Clusters nicht * * notwendigerweise entsprechen Ziffern gehört. Verwenden Sie kein Clustering zur Klassifizierung! –
@ Anony-Mousse Ich wollte fragen, angenommen, Sie hatten keine Etiketten in der MNIST-Datensatz, dann, wie es Cluster würde –
Die Cluster werden höchstwahrscheinlich nicht Ziffern entsprechen. –