Nach dem Beispiel hierrmagic, IPython und Zusammenfassung Informationen
http://www.randalolson.com/2013/01/14/filling-in-pythons-gaps-in-statistics-packages-with-rmagic/
versuchte ich das gleiche auf einem anderen Datensatz hier, in einem IPython Notebook.
https://github.com/burakbayramli/kod/blob/master/delltest/dell.tgz
from pandas import *
orders = read_csv("dell.csv",sep=",")
%load_ext rmagic
%R -i orders print(summary(orders))
ich
Length Class Mode
[1,] 25 -none- list
[2,] 25 -none- list
[3,] 25 -none- list
..
die gleiche jedoch in R
data <- read.csv ("dell.csv",header=TRUE,sep=",")
print (summary(data))
mir die korrekte Zusammenfassung Informationen gibt.
rank per_customer_count total_total_amount orderid
Min. : 1.000 Min. : 1.000 Min. : 0.14 Min. : 1
1st Qu.: 2.000 1st Qu.: 6.000 1st Qu.: 866.11 1st Qu.: 2964
Median : 4.000 Median : 8.000 Median : 1764.08 Median : 5980
Mean : 4.997 Mean : 9.426 Mean : 2004.95 Mean : 5987
3rd Qu.: 7.000 3rd Qu.:12.000 3rd Qu.: 2856.06 3rd Qu.: 9004
...
Irgendwelche Ideen?
Als Vermutung, es ist die Pandas Datenrahmen an eine R-Matrix umwandelt, anstatt ein R Datenrahmen. Wir sollten das verbessern. –
@ Thomas-K: Es schien mir, dass es in eine Liste von Listen (von Listen) umgewandelt wurde. Wir sollten ein Problem auf der Entwickler-Website für ipython öffnen (macht dort mehr Sinn als auf der Website von rpy2) und arbeiten an der Verbesserung der Konvertierungsregeln, die rmagic verwendet. – lgautier
Ich habe das Problem auf der GH-Seite für ipython erstellt - https://github.com/ipython/ipython/issues/2797 – user423805