Ich arbeite an einem Datenrahmen in Pandas mit vier Spalten user_id
, time_stamp1
, time_stamp2
und interval
. Time_stamp1 und time_stamp2 haben den Typ datetime64 [ns] und interval den Typ timedelta64 [ns].add timedelta Daten innerhalb einer Gruppe in Pandas Datenrahmen
Ich möchte in dem Datenrahmen für jeden User_id Intervallwert summieren und ich versuchte es in vielerlei Hinsicht wie zu berechnen:
1)df["duration"]= df.groupby('user_id')['interval'].apply (lambda x: x.sum())
2)df ["duration"]= df.groupby('user_id').aggregate (np.sum)
3)df ["duration"]= df.groupby('user_id').agg (np.sum)
aber keiner von ihnen arbeiten und der Wert der duration
wird NaT
sein nach die Codes laufen lassen.
was über 'df.groupby ('us er_id ') [' interval ']. sum() 'oder' df.groupby (' user_id ') [' interval ']. agg (' sum ') '? – MaxU
Ich überprüfte auch diese beiden, aber das Ergebnis in der "duration" Spalte ist '' Nat'' – user3854325
können Sie einige Beispieldatensatz? – MaxU