Ich versuche nur eine Spalte aus den langen und großen Datensätzen zu säubern. Die Daten haben 18 Spalten, mehr als 10k + Zeilen ungefähr 100s von csv-Dateien, von denen ich nur eine Spalte säubern möchte.Eine Spalte von langen und großen Datensätzen bereinigen
Eingabefelder nur wenige aus der langen Liste
userLocation, userTimezone, Coordinates,
India, Hawaii, {u'type': u'Point', u'coordinates': [73.8567, 18.5203]}
California, USA
, New Delhi,
Ft. Sam Houston,Mountain Time (US & Canada),{u'type': u'Point', u'coordinates': [86.99643, 23.68088]}
Kathmandu,Nepal, Kathmandu, {u'type': u'Point', u'coordinates': [85.3248024, 27.69765658]}
Volleingabedatei: Dropbox link
Code:
import pandas as pd
data = pandas.read_cvs('input.csv')
df = ['tweetID', 'tweetText', 'tweetRetweetCt', 'tweetFavoriteCt',
'tweetSource', 'tweetCreated', 'userID', 'userScreen',
'userName', 'userCreateDt', 'userDesc', 'userFollowerCt',
'userFriendsCt', 'userLocation', 'userTimezone', 'Coordinates',
'GeoEnabled', 'Language']
df0 = ['Coordinates']
Andere Spalten geschrieben, wie es in der Ausgabe ist. Wie geht man danach?
Ausgang:
userLocation, userTimezone, Coordinate_one, Coordinate_one,
India, Hawaii, 73.8567, 18.5203
California, USA
, New Delhi,
Ft. Sam Houston,Mountain Time (US & Canada),86.99643, 23.68088
Kathmandu,Nepal, Kathmandu, 85.3248024, 27.69765658
Der mögliche einfachste Vorschlag oder lenkt mich zu einem gewissen Beispiel wird viel hilfreich sein.
Vielen Dank für die Antwort. –
Vielen Dank .. Dies hat die Hälfte meines Problems gelöst. –