ich einen Datensatz mit rund 2 Millionen Zeilen haben und 50 SpaltenProbleme mit dem Entfernen von konstanten Funktionen unter Verwendung von Standardabweichung Python Pandas
ich einige dieser Spalten wissen konstante Datenwerte - z alle Zeilen in dieser Spalte den gleichen Wert
Deshalb dachte ich, dass ich mit allen konstanten Spalten zu finden wäre in der Lage:
for col in data.columns:
print data[col].std()
jedoch die Spalte (n) mit 0 Standardabweichungen, kehren mich etwa Standardabweichungen 0,000000012 (sehr geringe Abweichungen - nicht 0)
ich alle Werte überprüft haben, sind konstant durch die folgende
print data[data['col3'] != 0.538]
W läuft hich gibt ein leeres Array zurück (alle Werte sind 0,538 für diese Spalte)
Warum gibt die Standardabweichung 0 für diese Spalte nicht zurück?
Entschuldigung für das Posten einer solchen spezifischen Frage, aber ich bin sehr verwirrt darüber, wie das funktioniert.
Jeder Rat würde sehr geschätzt werden.
Danke, J
Haben Sie versucht, nach 'ddof = 0' zu suchen, da pandas' ddof = 1' als Standardwert betrachtet? –
Sie können value_counts oder unique als Selektor ausprobieren. – Merlin