Ich verfolge meine previous question.CSV-importierte Datenrahmen zusammenführen/verketten und Duplikate löschen
Haben Sie eine Schleife aussortiert, um CSVs zu importieren, Daten zu verketten und Duplikate zu entfernen.
files = glob.glob('./A08_csv/A08_B1_T*.csv')
dfs = [pd.read_csv(fp, index_col=[0], parse_dates=[0], dayfirst=True) for fp in files]
df = pd.concat(dfs)
df_purged = df.drop_duplicates(inplace=True)
print df_purged
jedoch df.drop_duplicates (Inplace = True) funktioniert nicht (sicher ich bin etwas fehlt) und drucken eine Leere zurück. Wie kann ich angeben, die Duplikate nach Index zu überprüfen? Das Hinzufügen des Spaltennamens scheint nicht zu funktionieren.
Auch, wie kann ich diese Schleife in eine Formel transformieren, so kann ich diese rekursive Eingabe in CSV mit verschiedenen Dateinamen (dh etwas, das für A08_B1_T * .csv (Schlafzimmer) und für A08_KI_T * .csv (Küche) etc.)?
Sicherlich wäre es (und ich versuchte es), aber die proble m Ich möchte, dass die Duplikate basierend auf dem Index (Datum und Uhrzeit) identifiziert werden und nicht wissen, wie man den Index anstelle von 'col_name' verwendet. Wenn ich tippe: 'df.drop_duplicates (['Date Time'])' was ist der Spaltenname auf der CSV, dann bekomme ich einen Key Error – Andreuccio
lassen Sie mich wissen, wenn die Bearbeitung funktioniert – SerialDev
Cmari, vielen Dank dafür. Ich bekomme jetzt 'KeyError: 'index''. – Andreuccio