Im Anschluss an meine vorherige Frage habe ich einen Clustering-Algorithmus für eine große Anzahl von Strings mit Python & Levenshtein Abstand implementiert .. Aber es dauert sehr lange, Clustering abzuschließen. Irgendwelche Vorschläge bitte?Implementieren hierarchischen Clustering in Python mit Levenshtein Abstand
<> Iterierte thro die Liste in einem for-Schleife für jedes Element in der Liste Lauf durch die Liste wieder Ähnlichkeitsprozent zu finden wenn Ähnlichkeit> threshold, Ende für Schlaufe
Die heißen Teile in Cython neu schreiben. –