Die Hilfeseite für randomforest::randomforest()
sagt:Was bedeutet der Parameter 'classwt' in RandomForest im RandomForest-Paket in R?
"classwt - Priors der Klassen deckenden Bedarf einen nicht aufaddieren für die Regression nicht berücksichtigt.."
Konnte die Einstellung classwt
Parameter helfen, wenn Sie schwere unsymmetrische Daten haben, dh. priors der Klassen unterscheidet sich stark?
Wie soll ich classwt
beim Training eines Modells auf einem Datensatz mit 3 Klassen mit einem Vektor von Priors gleich (p1, p2, p3) setzen, und in Testsatz Prioren sind (q1, q2, q3)?
Ich bin mir nicht sicher über Ihre zweite Frage, aber 'classwt' Ich glaube, dass verwendet wird, wenn Proben aus Ihren Daten, so dass jedes Beispiel für jeden Baum aus Ihren Klassen mit diesen Wahrscheinlichkeiten gezogen wird (nach Normalisierung). – joran
strata liefert die gleiche Leistung wie classwt und ist einfacher zu kontrollieren, lesen Sie diese Anleitung auf SO: http://stats.stackexchange.com/questions/157714/r-package-for-weighted-random-forest-classwt-option/158030 # 158030 –
@joran das ist stratification du beschreibst. Classwt wird verwendet, um Stichproben zu gewichten, wenn der optimale Knickpunkt für die Knotenaufteilung gefunden werden soll, und um die Knotenvorhersage während des Trainings zu definieren. –