Kann jemand bitte erklären, gibt es einen Vorteil der Verwendung hierarchischer Clustering über spektrale Clustering? Ich weiß, wie sie funktionieren, aber ich möchte wissen, in welchen Situationen es besser ist, hierarchisches Clustering über spektrales Clustering zu verwenden.Spectral Clustering vs hierarchische Clustering
2
A
Antwort
2
Hierarchical Clustering:
- Es ist gut für taxonomische Daten.
- Schließen Sie ähnliche Punkte an, bis Sie einen einzelnen Cluster mit allen Datenpunkten erhalten.
- Aus der Gruppierung, die Sie nach dem Kombinieren aller Daten erhalten, wird ein Dendrogramm genannt.
- Je nachdem, wie viele Cluster Sie möchten, schneiden Sie das Dendrogramm auf einer Ebene.
Spectral Clustering:
- Es ist für das Clustering-Daten, die in komplexer Form als K-means und dichtebasierte clustering in diesen Fällen versagen.
- Behandeln Sie die Datenpunkte als Scheitelpunkte eines Diagramms und verbinden Sie die Scheitelpunkte, die nahe genug sind. Daher wählen Sie auch einen ε-Wert. Alle Ecken, die näher als ε sind, sind verbunden.
- Im Gegensatz zum hierarchischen Clustering erhalten Sie keinen vollständig verbundenen einzelnen Graphen (es sei denn, Sie nehmen einen hohen ε-Wert und es gibt keine nicht verbundenen Komponenten). Stattdessen erhalten Sie mehrere verbundene Komponenten, von denen jede einen Cluster darstellt.
2
Hierarchisches Clustering ist normalerweise schneller und erzeugt ein schönes Dendrogramm zum Studium.
Dendrogramme sind sehr nützlich, um zu verstehen, ob Sie eine gute Clusterbildung haben.
Darüber hinaus ist hierarchische Clustering sehr flexibel. Sie können verschiedene Abstandsfunktionen und verschiedene Verknüpfungsstrategien verwenden.
Spektrale Clustering hat eine interessante Theorie; Aber um wirklich gut zu arbeiten, müssen Ihre Daten bereits aus gut getrennten "connectedd components" bestehen. Wenn Sie sehr laute Daten haben, viel Glück.