Warum der Unterschied in der Leistung auf diese drei Methoden, um Gruppen aus einem 32m Zeile Datenrahmen in Pandas zu bekommen.Warum der Unterschied in der Geschwindigkeit, um Gruppen in Pandas zu bekommen
df = df.groupby(["a", "b", "c"]).groups
df = df.groupby(["a", "b", "c"]).count()
df = df.index
df = df.groupby(["a", "b", "c"]).count()
df = df.drop(df.columns, axis=1).reset_index()
Die letzte Methode dauert < 10 Sekunden. Ich gab es auf, auf die anderen beiden zu warten.
EDIT: hinzugefügt die eckigen Klammern, die verpasst wurden.
Keine dieser Methoden funktioniert (das ist jetzt, wie Sie groupby verwenden). Sie ordnen einem Datenrahmen immer einige Ergebnisse zu und es ist unklar, was Sie zu tun versuchen. Bitte korrigieren Sie Ihren Code und erklären Sie, was Sie zu tun versuchen. – ayhan
Sorry verpasste die eckigen Klammern beim Eintippen hier. a, b, c sind Spalten – simon