2016-06-03 13 views
4

Ich habe einen Datenrahmen mit 250.000 Zeilen aber 140 Spalten und ich versuche, ein Paar-Diagramm zu konstruieren. der Variablen. Ich weiß, dass die Anzahl der Subplots sehr groß ist, ebenso wie die Zeit, die für die Plots benötigt wird. (Ich warte mehr als eine Stunde auf einem i5 mit 3,4 GHZ und 32 GB RAM).Was sind Wege, Seaboons zu beschleunigen? Pairplot

Erinnern Sie sich, dass scikit learn erlaubt, zufällige Wälder parallel zu konstruieren, ich habe geprüft, ob das auch mit seaborn möglich war. Ich habe jedoch nichts gefunden. Der Quellcode scheint die matplotlib-Plotfunktion für jedes einzelne Bild aufzurufen.

Konnte das nicht parallelisiert werden? Wenn ja, was ist ein guter Start von hier?

Antwort

0

Anstatt parallelisieren zu können, könnten Sie Ihre DataFrame auf 1000 Zeilen herunterskalieren, um einen schnellen Blick zu bekommen, wenn der Geschwindigkeitsengpass tatsächlich dort auftritt. 1000 Punkte reichen aus, um einen Überblick zu bekommen, was normalerweise vor sich geht.

, d.h. sns.pairplot(df.sample(1000)).