Ich möchte alle Beobachtungen untersuchen, die einen Knoten in einem Rpart-Entscheidungsbaum erreicht haben. Zum Beispiel in dem folgenden Code:Abrufen der Beobachtungen in einem Rpart-Knoten (z. B. CART)
fit <- rpart(Kyphosis ~ Age + Start, data = kyphosis)
fit
n= 81
node), split, n, loss, yval, (yprob)
* denotes terminal node
1) root 81 17 absent (0.79.20987654)
2) Start>=8.5 62 6 absent (0.90322581 0.09677419)
4) Start>=14.5 29 0 absent (1.00000000 0.00000000) *
5) Start< 14.5 33 6 absent (0.81818182 0.18181818)
10) Age< 55 12 0 absent (1.00000000 0.00000000) *
11) Age>=55 21 6 absent (0.71428571 0.28571429)
22) Age>=111 14 2 absent (0.85714286 0.14285714) *
23) Age< 111 7 3 present (0.42857143 0.57142857) *
3) Start< 8.5 19 8 present (0.42105263 0.57894737) *
Ich möchte alle Beobachtungen in Knoten sehen (5) (d.h .: die 33 Beobachtungen für die Startseite> = 8,5 & starten < 14,5). Offensichtlich konnte ich manuell zu ihnen kommen. Aber ich hätte gerne eine Funktion wie (zB) "get_node_date". Für die ich einfach get_node_date (5) ausführen könnte - und die relevanten Beobachtungen erhalten.
Irgendwelche Vorschläge, wie man das macht?
Sie haben nicht die Beobachtungen durchkommen, aber nur die Anzahl der abservations, die in eine Kategorie fallen – DatamineR
, Sie haben Recht, die Frage falsch verstanden –