Im Allgemeinen sollten Sie immer die Regel der Zusammenführung von zwei befolgen, wenn Sie alle typischen Eigenschaften des hierarchischen Clustering haben wollen (wie einheitliche Bedeutung von jedem "durchschneiden") - wenn Sie beginnen, viele Schritte zu einem zu verschmelzen haben eine "unausgeglichene" Struktur, so wird die Höhe des Clustering-Baumes an mehreren Stellen unterschiedliche Bedeutungen haben. Darüber hinaus ist es eigentlich nur sinnvoll für min linkage, wenn Sie avg linkage oder andere, komplexere Regeln verwenden, dann ist es nicht einmal richtig, nach dem Zusammenführen von zwei Punkten, der dritte wird der nächste sein, der hinzugefügt wird (es könnte sogar enden) in einem anderen Cluster). Im Allgemeinen ist Clustering dieses Typs (gierig) jedoch nur eine Heuristik mit bestimmten Eigenschaften. Wenn Sie es also ein wenig abwechseln, erhalten Sie ein weiteres Clustering mit einigen Eigenschaften. Zu sagen, welches "richtig" ist, ist unmöglich - sie sind beide in gewissem Maße falsch, worauf es später ankommt, ist die genaue Verwendung.