Ich arbeite am Titanic-Datensatz. Ich versuche, in der CABIN-Spalte Leerzeichen einzufügen. Ich habe den ersten Buchstaben aus CABIN-Spaltenwerten extrahiert und diese dann in die CABIN_NEW-Spalte geschrieben. Danach verwende ich rpart
für die Vorhersage, aber irgendwie jedes Mal, wenn ich den Code unten ausführe, nimmt R viel Zeit in Anspruch (noch nicht einmal beendet, jedes Mal muss ich es beenden).rpart Ausführung in R Studio
DATAset hat 1309 Zeilen und die Spalten, die ich verwende, sind unten im Code. Das System verwende ich läuft auf 4 GB Ram, i5-Prozessor und Windows 7.
combifit <- rpart(Cabin_New ~ Pclass + Sex + Age + SibSp + Parch + Fare + Embarked + Title
+ FamilySize + Surname + FamilyID,
data = combi[!is.na(combi$Cabin_New),], method = 'class')