Ich habe zwei (hunderte) dfs, die erzeugt und dann verkettet werden, die ich dann sortieren möchte, während die Zeilen mit identischen Spalten D
in der ursprünglichen Reihenfolge erhalten bleiben :Sortierung nach den Werten einer Spalte, wobei die Zeilen nach dem Wert einer anderen Spalte gruppiert werden
In [120]: df_list[0]
Out[120]:
A B C D
0 0.564678 0.598355 0.606693 MA0835
1 0.066291 0.063587 0.662292 MA0835
2 0.000000 0.000000 0.010758 MA0835
3 0.000000 0.000000 0.097895 MA0835
4 0.000000 0.000000 0.136468 MA0835
In [121]: df_list[1]
Out[121]:
A B C D
0 0.628844 0.614492 0.570333 MA1002
1 0.317790 0.293189 0.239368 MA1002
2 0.000000 0.000000 0.000000 MA1002
3 0.000000 0.000000 0.000000 MA1002
4 0.000000 0.000000 0.000000 MA1002
In [122]: df = pd.concat(df_list[0:2])
In [122]: df
Out[122]:
A B C D
0 0.564678 0.598355 0.606693 MA0835
1 0.066291 0.063587 0.662292 MA0835
2 0.000000 0.000000 0.010758 MA0835
3 0.000000 0.000000 0.097895 MA0835
4 0.000000 0.000000 0.136468 MA0835
0 0.628844 0.614492 0.570333 MA1002
1 0.317790 0.293189 0.239368 MA1002
2 0.000000 0.000000 0.000000 MA1002
3 0.000000 0.000000 0.000000 MA1002
4 0.000000 0.000000 0.000000 MA1002
Standardsortierung erzeugt:
In [125]: df.sort_values('A',ascending=False)
Out[125]:
A B C D
0 0.628844 0.614492 0.570333 MA1002
0 0.564678 0.598355 0.606693 MA0835
1 0.317790 0.293189 0.239368 MA1002
1 0.066291 0.063587 0.662292 MA0835
2 0.000000 0.000000 0.010758 MA0835
3 0.000000 0.000000 0.097895 MA0835
4 0.000000 0.000000 0.136468 MA0835
2 0.000000 0.000000 0.000000 MA1002
3 0.000000 0.000000 0.000000 MA1002
4 0.000000 0.000000 0.000000 MA1002
Allerdings würde Ich mag auf A
sortieren und die Zeilengruppierungen zu halten, wie durch D
angegeben. Dies ist die gewünschte Ausgabe:
A B C D
0 0.628844 0.614492 0.570333 MA1002
1 0.317790 0.293189 0.239368 MA1002
2 0.000000 0.000000 0.000000 MA1002
3 0.000000 0.000000 0.000000 MA1002
4 0.000000 0.000000 0.000000 MA1002
0 0.564678 0.598355 0.606693 MA0835
1 0.066291 0.063587 0.662292 MA0835
2 0.000000 0.000000 0.010758 MA0835
3 0.000000 0.000000 0.097895 MA0835
4 0.000000 0.000000 0.136468 MA0835
Muss ich mit groupby
arbeiten müssen, oder gibt es eine andere Sortierung/Gruppierung Technik, die ich mit unbekannten bin?
Ist die absolute Reihenfolge der "D" wichtig oder wäre es akzeptabel, wenn die Reihenfolge alphabetisch war? – Grr
Die 5 Zeilen, die jedem 'D' zugeordnet sind, sollten in der gleichen Reihenfolge gehalten werden, wie der Index für jedes' D' anzeigt. – AGS
Meine Schuld, ich war nicht klar. Ist die Reihenfolge jeder 5-Zeilen-Gruppierung in 'D' wichtig? Zum Beispiel wäre es akzeptabel, wenn die Gruppe von MA0835 vor der Gruppe von MA1002 käme? – Grr