Ich weiß, wie eine (schöne) Pandas Korrelationstabelle, durch Korrelation Platz zu schaffen:Pandas Korrelationstabelle von n Zeilen m Spalten begrenzt
c = df.corr().abs()
np.set_printoptions(threshold='nan')
s = c.unstack()
so = s.order(kind="quicksort")
pprint(so)
Das ist großartig.
Das Problem ist, dies gibt die Korrelationen für die vollständige Matrix der Werte - für alle Spalten x alle Spalten, in einer Kreuzmatrix.
Aber was, wenn ich nur eine Spalte, sagen wir df['m']
, für seine Korrelationen über alle anderen Spalten überprüfen möchte?
Muss ich zwei Datenrahmen erstellen und die Korrelationen zwischen ihnen überprüfen? Gibt es ein schnelleres Skript?