Ich importiere eine Web-Log-Text-Datei in Python mit Pandas. Python liest die Header, hat jedoch den Text "Fields:" als Überschrift verwendet und am Ende eine weitere Spalte mit Leerzeichen (NaNs) hinzugefügt. Wie kann ich verhindern, dass dieser Text als Spaltenüberschrift verwendet wird? mein CodeWie Sie Text als Spaltenüberschrift mit Python übersprungen werden
hier:
arr = pd.read_table("path", skiprows=3, delim_whitespace=True, na_values=True)
Hier ist der Anfang der Datei:
Software: Microsoft Internet Information Services 7.5
Version: 1.0
Datum: 2014- 08-01 00:00:25
Felder: Datum Uhrzeit
2014.08.01 00.00.25 ...
Ergebnis ist, dass ‚Fields‘ als Spaltenüberschrift und eine Säule voller NaN-Werte für die Spalte ‚Zeit‘ wird erstellt verwendet wird.
Danke, ich habe das Problem zu umgehen und die Spaltenüberschriften hinzugefügt zurück in Verwendung diese qanda: http://stackoverflow.com/questions/17018638/assigning-column-names-from-a-list-to-a-table Aber sicherlich gibt es einen besseren Weg, anstatt es den falschen Text zu lesen – W4K1NG
Oh ja, Ich habe deine Frage nicht verstanden. Sie sollten nur die Datei editieren und '' Fields: '' durch '' '' ersetzen (das können Sie in Ihrem Python-Skript mit 'replace' tun) – maxymoo