2016-06-24 27 views
-2

Ich mache gerade ein Kundensegmentierungsprojekt in SAS.Wie wähle ich eine angemessene Anzahl von Kunden für die Clusteranalyse?

Ich habe 2700 Kunden identifiziert, die in jedem der 4 Jahre, die ich analysiere, einen Kauf getätigt haben. Je mehr Käufe/Kunden pro Jahr die Clusterqualität analysieren, desto besser ist die Datenqualität. Da ich jedoch die Anzahl der Einkäufe, die pro Kunde pro Jahr benötigt werden, selektiver wählen kann, können weniger Kunden in der Clusteranalyse berücksichtigt werden.

Wie soll ich den Cutoff-Punkt für die Anzahl der Käufe pro Kunde pro Jahr auswählen, die für die Analyse berücksichtigt werden? Ich kämpfe mit diesem Kompromiss zwischen Datenqualität und genug Kunden für die Analyse.

Vielen Dank! :)

+0

Was ist Ihr Endziel? –

+0

Mein Ziel ist es, die Konsumenten anhand ihres Kaufverhaltens in vier Gruppen einzuteilen. Die Variablen für die Clusteranalyse sind Markterfahrung und Anfälligkeit für Werbung. – George

+0

Also würde ich vorschlagen, dass Sie mehrere cut-offs machen und dann die Änderungen untersuchen. Wenn sich nichts ändert, ist es egal. Oder ein Cut-off ist optisch besser als das andere. –

Antwort

0

Es gibt keinen richtigen Weg. Es hängt vollständig von Ihren Daten ab.

Clustering solcher Daten ist "magisch" und die Ergebnisse neigen dazu, alle außer statistisch gesund zu sein. Mehr wie zufällige Gueses.

Deshalb versuchen Sie immer mehrere Parameter und überprüfen Sie sorgfältig die Ergebnisse. Keine Gleichung wird jemals sagen, was eine gute Clusterbildung ist.