Wenn die Faktorvariable Climate ist, mit 4 möglichen Werten: Tropical, Arid, Temperate, Snow und ein Knoten in meinem rpart
Baum ist als "Climate: ab" gekennzeichnet, was ist der Split?Wie interpretiere ich rpart Splits auf Faktorvariablen beim Erstellen von Klassifikationsbäumen in R?
5
A
Antwort
6
Ich nehme an, Sie Standardmethode verwenden Baum zu zeichnen, die
plot(f)
text(f)
ist, wie Sie in der Hilfe zu text.rpart
lesen können, Argument pretty
auf Standardfaktor Variablen werden als Buchstaben dargestellt, so a
bedeutet levels(Climate)[1]
und es bedeutet, dass auf dem linken Knoten sind Beobachtung mit Climate==levels(Climate)[1]
und auf der rechten Seite die anderen.
Sie könnten Ebenen direkt drucken
plot(f)
text(f, pretty=1)
verwenden, aber ich empfehlen draw.tree
von maptree package:
require(maptree)
draw.tree(f)
ich Fälschung verwendet Daten zu Plots:
X <- data.frame(
y=rep(1:4,25),
Climate=rep(c("Tropical", "Arid", "Temperate", "Snow"),25)
)
f <- rpart(y~Climate, X)
Dies gehört zu stats.stackexchange.com und sollte geschlossen werden. –
@Joris stimme ich nicht zu. Die Frage betrifft die Interpretation einer Programmantwort und hat nichts mit dem statistischen Hintergrund der Partitionierungsbäume und der Statistik selbst zu tun. – Marek
@ Marek Wie sonst würden Sie die Interpretation einer statistischen Analyse nennen? –