Ich versuche, einige meiner Verarbeitungsarbeit von R nach Python zu verschieben. In R verwende ich read.table(), um wirklich unordentliche CSV-Dateien zu lesen, und es teilt automatisch die Datensätze im richtigen Format auf. Z.B.R read.table entspricht in Python
391788,"HP Deskjet 3050 scanner always seems to break","<p>I'm running a Windows 7 64 blah blah blah........ake this work permanently?</p>
<p>Update: It might have something to do with my computer. It seems to work much better on another computer, windows 7 laptop. Not sure exactly what the deal is, but I'm still looking into it...</p>
","windows-7 printer hp"
ist korrekt in 4 Spalten getrennt. 1 Datensatz kann über viele Zeilen verteilt werden und es gibt Kommas überall. In R ich nur tun:
read.table(infile, header = FALSE, nrows=chunksize, sep=",", stringsAsFactors=FALSE)
Gibt es etwas in Python, die das genauso gut tun können?
Danke!
Aber das gibt nur Strings zurück. Es leitet den Typ jeder Spalte nicht so ab wie die read.table. –