2016-08-06 15 views
-2

Ich lese eine CSV-Datei mit 'pd.read_csv' und schreibe sie in eine andere csv mit 'file.to_csv'. Es zeigt die Header in der Ausgabedatei falsch an. Zum BeispielPandas read_csv liest Header falsch

Eingang:

ABC | 20151004 | 1900 | 0000000002 | MUPPETS SP 1-10/4, THE | | | R|RS 

0 

0 

0 

0 

0 

2993 

Skript:

data = pd.read_csv(r'filepath/input.csv') 

Druckdaten

Eingangskopf: ABC | 20151004 | 1900 | 0000000002 | MUPPETS SP 1-10/4, THE | | | R|RS

Output-Header: ABC | 20151004 | 1900 | 0000000002 | MUPPETS SP 1-10/4, THE | | | R|RS.1

Nicht sicher, warum es '.1' bis Ende einige der Header hinzugefügt wird.

+2

hinzufügen ersten fünf Zeilen aus CSV-Datei hier wahrscheinlich anzeigt. – RAVI

+0

Mögliches Duplikat von http://stackoverflow.com/questions/20845213/how-to-avoid-python-pandas-creating-an-index-in-a-saved-csv – Kartik

+0

Bessere doppelte Frage: http: // stackoverflow. com/questions/26786960/pandas-zu-csv-first-extra-spalte-remove-how-to – Kartik

Antwort

0

Try this:

data = pd.read_csv(r'filepath/input.csv',sep='|') 

Die Rs.1 von doppelten 'rs' Spalten

+0

Vielen Dank. Du hast recht. Es ist eine große Datei und ich habe es nicht bemerkt. Es ist eine doppelte Spalte. Gibt es eine Möglichkeit, die Spalte so zu lesen, wie sie ist, ohne am Ende ".1" hinzuzufügen? –

+0

müssen Sie einige Spalten hinzufügen, um die Frage zu lösen. Diese sehen nicht wie Header aus, sondern ihre Daten. Sie müssen auch ein Tutorial durcharbeiten, bevor Sie Fragen stellen. https://people.duke.edu/~ccc14/sta-663/IntroductionToPythonSolutions.html – Merlin