2016-08-02 50 views
2

Ich lese in einem csv, aber wenn ich mir die Spaltennamen genauer anschaue gibt es neben dem ersten Spaltennamen ein seltsames Symbol. Kann mir jemand helfen, dieses Symbol loszuwerden?Warum hat der Spaltenname im Datenrahmen Symbole?

Wie Spaltennamen suchen jetzt (nicht sicher, was die Symbole neben 'Jahr' bedeutet:

['year', 'sch', 'city', 'prop_id'] 

Wie ich Spaltennamen suchen möchten:

['year', 'sch', 'city', 'prop_id'] 

mein Code so weit:

import pandas as pd 

path = ('file_path') 

cameron_county = pd.read_table(path + '/2016_GCC_prelim_appraisal_info_20160630.txt', 
          encoding = 'latin1',error_bad_lines = False) 

print(cameron_county.head(1)) 
print(cameron_county.columns) 

danken Ihnen im Voraus.

+0

Sind Sie sicher, dass Sie die richtige Codierung verwenden? – ayhan

Antwort

2

Ein Post-Import Lösung könnte so aussehen:

columns = pd.Index(['year', 'sch', 'city', 'prop_id']) 
columns.str.replace(r'[^a-zA-Z0-9_-]', '') 

Index([u'year', u'sch', u'city', u'prop_id'], dtype='object') 
+0

danke für die Antwort EdChum löste es für mich! – RustyShackleford