2016-05-09 7 views
-1

Ich habe implementieren 3 Clustering-Algorithmen in R (PAM, k-Mittel und hierarchisch). Ich möchte herausfinden, welche Parameter die besten Ergebnisse jedes Algorithmus ergeben.Vergleichen Sie die Clustering-Algorithmen in R

Ich habe keine Ahnung, wie es

in R. zu tun

Wer weiß, wie es zu tun?

Vielen Dank für Ihre Hilfe.

+0

Definieren Sie "beste Ergebnisse", wie es für Clustering gilt – Andrie

+0

Zum Beispiel habe ich 7 Cluster und ich muss es mit der Klassenvariablen vergleichen. Wie zu vergleichen, ob das Clustering effektiv auf den Algorithmus angewendet wird. Gibt es ein Werkzeug, das der R bietet oder irgendein Prozentsatz die Genauigkeit veranschaulichen? –

+0

Auschecken NBKlicken! –

Antwort

0

Sie benötigen eine Statistik, die für alle 3 Clustering-Methoden wie BIC-Kriterium berechnet werden kann.

Das Modell mit dem niedrigsten BIC wäre am besten. Dieses Kriterium sollte jedoch mit Vorsicht angewendet werden, da Überanpassungen ein häufiges Problem darstellen.