Ich habe einen Datenrahmen wie folgt aus:Erfassung der Reihenfolge des Auftretens einer ID in Datenrahmen mit Python
ID Product
10001 A
10001 B
10001 C
10002 D
10002 A
10001 F
10001 X
10002 N
Was ich in der Ausgabe wollen, ist der Reihenfolge des Auftretens eines gesonderten ID in aufeinanderfolgenden Zeilenfolge und die Zählungen in dass das Auftreten:
ID Product Order_occurrence Count
10001 A 1 3
10001 B 1 3
10001 C 1 3
10002 D 1 2
10002 A 1 2
10001 F 2 2
10001 X 2 2
10002 N 2 1
Wir können die Zählung durch Gruppe erhalten, indem bei ID und Vorkommen, aber nicht sicher, wie das Auftreten zu bekommen, das in der Reihenfolge der Zeilen ist. Mir ist nichts bekannt wie Lag-Funktion in Python.
Können Sie die Logik hinter 'Order_occurrence' erklären? – DeepSpace
Denken Sie, dass es 50 eindeutige IDs in den Daten gibt, deren Auftreten an jedem Punkt für verschiedene Produkte wiederholt werden kann. Also möchte ich die Bestellung für jede ID erfassen, was so aussehen könnte, als hätte ID verschiedene Produkte an verschiedenen Tagen gekauft. Also alle Produkte aufeinander folgenden IDs sind ein einziges Vorkommen und erhöht sich, wenn wir diese ID wieder sehen, wenn wir die verschiedenen Zeilen in Spalte ID durchlaufen – muni
Es tut mir leid, aber ich sehe immer noch nicht, warum würde 'ID 10001' für' Produkt A - C' wird '1' und' 10001 F' wird '2'. – DeepSpace