2016-06-21 13 views
-2

Ich verwende ELKI, um Location Clustering mit DBSCAN und OPTICS durchzuführen. Mein Datensatz enthält 30 Teilnehmer, aber es ist nicht beschriftet, aber ich habe ein Paar Koordinaten (z. B. Zuhause, Arbeit, usw.) als häufige Orte für jeden Teilnehmer.Cluster externe Validierung

Ich möchte wissen, dass diese Koordinatenpaare zu welchem ​​Cluster (für jede Person) gehören. Einer der Wege besteht darin, jedes Paar manuell gegen jeden der Cluster zu prüfen, indem man einen Mindestdistanzschwellenwert verwendet.

Was könnte der bessere Weg sein, dies zu erreichen?

+0

Ich verstehe Ihr Ziel nicht. –

+0

Eigentlich möchte ich die Cluster gegen die Grundwahrheit validieren. – user1124825

+0

Die Daten sind nicht beschriftet, aber ich kenne die häufigen Aufenthaltsorte von Personen, im Durchschnitt hat jede Person 4 bis 6 verschiedene Standorte. – user1124825

Antwort

1

Können Sie Ihre Eingabedaten als dieses Format:

123 456 work1 
124 457 work1 
789 123 home2 
123 123 unknown 

Die Etiketten sollten nicht numerisch sein, das ist, warum ich „work1“ entschieden „work2“ usw. für dieses Beispiel.

Dann kann ELKI das Ergebnis automatisch auswerten.