können Regressionsfehler Metriken wie der mittlere quadratische Fehler (RMSE) oder die Summe der quadrierten Fehler (SSE) von Hand berechnen wie von @ nathan-day hervorgehoben. Die meisten Implementierungen werden dies automatisch für Sie tun, so dass Sie dies normalerweise nicht manuell durchführen müssen.
Für den Plotvorgang werde ich jetzt ein etwas größeres Beispiel verwenden, mit mehr Proben, wie es besser zu verstehen ist (der iris
Datensatz, der mit R geliefert wird). Zuerst haben wir ein lineares Modell trainieren, um das vierte Merkmal von den ersten drei Merkmalen vorherzusagen, welche bereits einige Metriken berechnet:
> model <- train(iris[,1:3], iris[,4], method = 'lm', metric = 'RMSE', trControl = trainControl(method = 'repeatedcv', number = 10, repeats = 10))
> print(model)
Linear Regression
150 samples
3 predictors
No pre-processing
Resampling: Cross-Validated (10 fold, repeated 10 times)
Summary of sample sizes: 134, 135, 135, 136, 134, 135, ...
Resampling results
RMSE Rsquared RMSE SD Rsquared SD
0.19 0.942 0.0399 0.0253
Der RMSE, SSE, usw. konnte nun von den vorhergesagten und tatsächlichen Werten des Ziels berechnet werden zu variabel von Hand:
predicted <- predict(model, iris[,1:3]) # perform the prediction
actual <- iris[,4]
sqrt(mean((predicted-actual)**2)) # RMSE
sum((predicted-actual)**2) # SSE
die geringfügigen Unterschiede zu den Ergebnissen der Modelltraining oben ergibt sich aus einer wiederholten Kreuzvalidierung verwendet (daher sind die Metriken, die unter „Resampling Ergebnisse“ gibt).
Für den Plotteil: Regressionsfehler kann leicht visualisiert werden, indem die vorhergesagte gegen die tatsächliche Zielvariable gezeichnet wird und/oder indem der Fehler gegen den tatsächlichen Wert aufgetragen wird. Die perfekte Anpassung wird durch die zusätzliche Linie in diesen Zeichnungen dargestellt. Auch dies kann leicht mit Standard-Tools erreicht werden:
plot(predicted~actual)
abline(0,1)
plot(predicted-actual~actual)
abline(0,0)
PS: wenn Sie nicht vertraut sind mit Regression/Klassifizierung Fehlermaß und robust ML Verfahren ich dringend einige Zeit empfehlen würde, die Ausgaben auf die Themen zu lesen - es wird wahrscheinlich sparen Sie später viel Kalk. Ich persönlich würde Applied Predictive Modeling von Max Kuhn (Betreuer des caret
Pakets in R) und Kjell Johnson empfehlen, da es einfach zu lesen und sehr praktisch ist.
Können Sie erläutern, was Sie mit "Fehlerquote" meinen? Zum Beispiel [MAPE] (https://en.wikipedia.org/wiki/Mean_absolute_percentage_error)? – digEmAll