2016-07-17 20 views
0

Ich habe eine große Datenmenge, und ich versuche, R-Paket xgboost zu verwenden, um eine Regression darauf durchzuführen.R xgboost - Wie verwendet man lokale Datendateien?

Die Funktion xgboost sagt, dass das Argument data eine lokale Datendatei sein kann, von dem ich es verstehe der Name der Datei verwendet werden soll. Es gibt jedoch keine weiteren Angaben darüber, also ist meine Frage, wie genau diese Datei sein sollte.

Ich habe

versucht
random=matrix(rnorm(15),5,3) 
colnames(random)=c("first","second","label") 
write.csv(random,"random.csv") 
bst <- xgboost(data = "random.csv", 
       nthread = 7, 
       nround = 3, 
       objective="reg:linear", 
       verbose=FALSE) 

aber das gibt

6x0 matrix with 0 entries is loaded from random.csv 
Error in xgb.iter.update(bst$handle, dtrain, i - 1, obj) : 
NumCol:need column access 

Vielen Dank!

Antwort

0

Leider kann ich noch nicht kommentieren, und das ist ein bisschen naiv für eine richtige Antwort, aber nur um sicher zu sein: - Haben Sie dafür gesorgt, dass R im richtigen Ordner ist? Versuchen Sie getwd(), um zu überprüfen, in welchem ​​Arbeitsverzeichnis Sie sich befinden, und setwd(), um es zu ändern.

werde ich meine Antwort später löschen, da ich will, dass es unvollständig ist,

Grüße,

Daniel