In einem jupyter Notebook habe ich einen Datenrahmen aus verschiedenen zusammengeführten Datensätzen erstellt.Python/Pandas: Pivot-Tabelle
record_id | song_id | user_id | number_times_listened
0 |ABC | Shjkn4987 | 3
1 |ABC | Dsfds2347 | 15
2 |ABC | Fkjhh9849 | 7
3 |XYZ | Shjkn4987 | 20
4 |XXX | Shjkn4987 | 5
5 |XXX | Swjdh0980 | 1
Ich möchte eine Pivot-Tabelle Datenrahmen von song_id erstellen Auflistung der Anzahl der benutzerkennungen und die Summe von number_times_listened.
Ich weiß, dass ich eine for-Schleife mit den Zähl- und Summenfunktionen erstellen muss, aber ich kann es nicht funktionieren. Ich habe auch die pd.pivot_table des Pandas-Moduls ausprobiert.
df = pd.pivot_table(data, index='song_ID', columns='userID', values='number_times_listened', aggfunc='sum')
ODER so etwas?
hat perfekt funktioniert! Danke! – jeangelj
Für mein maschinelles Lernmodell brauche ich eine Kopfzeile - in diesem Szenario habe ich 3. Ich habe versucht, es innerhalb von Python ohne Erfolg zu beheben. Versuche, 2 Kopfzeilen zu löschen und habe eine behavior_df.columns = ['song_id', 'play_count_sum', 'user_id_count'] – jeangelj