Ich versuche Pandas zu verwenden, um in einer Datei mit Trennzeichen zu lesen. Das Trennzeichen ist ein griechisches Zeichen, kleingeschriebenes Rho (þ).in rho abgegrenzte Datei lesen
Ich habe Schwierigkeiten, die richtigen read_table Parameter zu definieren, so dass der resultierende Datenrahmen korrekt formatiert ist.
Hat jemand irgendwelche Erfahrungen oder Vorschläge damit?
Ein Beispiel für die Datei ist unter
TimeþUser-IDþAdvertiser-IDþOrder-IDþAd-IDþCreative-IDþCreative-VersionþCreative-Größe-IDþSite-IDþPage-IDþCountry-IDþState/ProvinceþBrowser-IDþBrowser-VersionþOS-IDþDMA-IDþCity-IDþZip -CodeþSite-DataþTime-UTC-Sec 03-28-2016-00: 50: 03þ0þ3893600þ7786669þ298662779þ67802437þ1þ300x250þ1722397þ125754620þ68þþ30þ0.0þ501012þ0þ3711þþþ1459122603 03-28-2016-00: 24: 29þ0þ3893600þ7352234þ290743769þ55727503þ1þ1x1þ1602646þ117915815þ68þþ31þ0.0þ501012þ0þ3711þþþ1459121069 03-28-2016-00: 13: 42þ0þ3893600þ7352234þ290743769þ55727503þ1þ1x1þ1602646þ117915815þ68þþ31þ0.0þ501012þ0þ37 11þþþ1459120422 03-28-2016-00: 21: 09þ0þ3893600þ7352234þ290743769þ55727503þ1þ1x1þ1602646þ117915815þ68þþ31þ0.0þ501012þ0þ3711þþþ1459120869
also sagen Sie, dass 'read_table (file, sep = r'ρ ')' nicht funktioniert? oder mit zusätzlichen Parametern 'encoding = 'utf-8'' oder' encoding =' utf-16''? – EdChum
Ja, das stimmt. –
Ich bin auf einer Windows-Maschine, die möglicherweise nicht hilft, aber ich möchte überprüfen, ob meine Syntax zuerst gut ist. Habe folgendes versucht. 'Importieren Pandas als PD Daten = pd.read_table ('C: \ Benutzer \ robin.sheridan \ Dokumente \ RCode \ NetworkImpression_5684_03-28-2016', sep = r'ρ ', nrows = 10, encoding =' utf-16 ') print (data) ' –