9
Ich habe diese beiden Methoden herausgefunden. Gibt es einen besseren?Was ist der beste Weg, um alle Werte in einem Pandas-Datenrahmen zu summieren?
>>> import pandas as pd
>>> df = pd.DataFrame({'A': [5, 6, 7], 'B': [7, 8, 9]})
>>> print df.sum().sum()
42
>>> print df.values.sum()
42
Ich möchte nur sicherstellen, dass ich nicht etwas offensichtlicher vermisse.
Dank. Das ist was ich dachte! – Bill
Ist es schneller, weil eine Funktion die andere aufruft oder gibt es einen fundamentaleren Unterschied? – kuanb
@ Kuanb zwei Gründe. One, 'df.values.sum()' ist eine 'numpy' Operation und die meiste Zeit ist' numpy' leistungsfähiger. Zwei, "numpy" -Summen über alle Elemente in einem Array unabhängig von der Dimensionalität. 'Pandas' erfordert zwei separate Aufrufe, um für jede Dimension eine Summe zu bilden. – piRSquared