ich einen Datenrahmen, die wie folgt zusammengefasst worden:Complex GROUPBY oder Pivot-Tabelle Berechnung in Python Pandas
UNIT CA DATE SCP TIME LABEL VALUES1 VALUES2
R001 A058 08-01-13 01-00-00 01:00:00 REGULAR 340751.000 194975.000
05:00:00 REGULAR 340753.000 194975.000
09:00:00 REGULAR 341251.000 194984.000
09:39:56 REGULAR 341440.000 194994.000
13:00:00 REGULAR 341808.000 195061.000
17:00:00 REGULAR 342030.000 195295.000
21:00:00 REGULAR 342214.000 195659.000
01-00-01 01:00:00 REGULAR 245262.000 221709.000
05:00:00 REGULAR 245262.000 221709.000
09:00:00 REGULAR 245428.000 221742.000
09:39:56 REGULAR 245508.000 221754.000
13:00:00 REGULAR 245620.000 221856.000
17:00:00 REGULAR 245679.000 222178.000
21:00:00 REGULAR 245743.000 222604.000
ich die Maximal- und Minimalwerte für VALUE1 und VALUE2 für jeden SCP berechnet man die Differenz extrahieren und zurück in das folgende Format:
UNIT CA DATE SCP DIFF OF MAX - MIN VALUE1 DIFF OF MAX - MIN VALUE2
R001 A058 08-01-13 01-00-00 .... ....
01-00-01 .... ....
Ich kann nicht herausfinden, wie es geht. Ich glaube, dass es einen Weg geben muss, es mit groupby oder pivot_table zu machen.
Vielen Dank im Voraus.
Siehe Antwort aktualisiert. – Stefan
Wie erstellen Sie den Multi-Index? Ich habe versucht, die Dokumentation der Pandas zu lesen, ist mir aber nicht klar. Nicht viel um das Internet herum. Vielen Dank. – Windstorm1981
Sie müssen nur mehrere Spalten als Index setzen - siehe Zeile am Anfang des Beispielcodes: 'df.set_index (['UNIT', 'CA', 'DATUM', 'SCP'], inplace = True)'. Wenn Sie sortieren wollen, gibt es 'df.sortlevel()'. – Stefan