Ich benutze Pandas, um eine CSV-Datei zu lesen. Die Daten sind Zahlen, aber in der CSV-Datei als Text gespeichert. Einige der Werte sind nicht numerisch, wenn sie fehlerhaft sind oder fehlen. Wie filtere ich diese Werte heraus und konvertiere die restlichen Daten in Ganzzahlen.Lesen von CSV in Python Pandas und Umgang mit schlechten Werten
Ich gehe davon aus, dass es einen besseren/schnelleren Weg gibt, als alle Werte zu durchlaufen und isdigit()
zu verwenden, um zu testen, ob sie numerisch sind.
Haben Pandas oder Numpy eine Möglichkeit, schlechte Werte im Lesegerät zu erkennen? Wenn nicht, was ist der einfachste Weg? Muss ich die dtypes spezifisch festlegen, um diese Arbeit zu machen?
Großartig. Das scheint genau das zu sein, wonach ich gesucht habe. – Dave31415
Gibt es eine Möglichkeit, na_values zu verwenden, wenn die Zeichenfolge spaltenabhängig ist? Zum Beispiel habe ich einige Spalten, in denen negative Werte schlecht sind, aber andere, wo sie in Ordnung sind. – Shawn
Nein @Shawn. Im Idealfall können Sie nicht na_values für jede Spalte anders durchführen. Die Verarbeitung negativer Werte sollte während der Datenvorverarbeitung/-reinigung erfolgen – JKC