2016-03-18 11 views
0

Ich versuche, ein lineares Modell mit LinearRegression von scikit anzupassen. Aus der Vorhersagefunktion erhalte ich eine Vorhersage der Punktschätzung, aber ich brauche eine Verteilung des möglichen Wertes, wobei wahrscheinlich der Punktwert von der Vorhersage der Mittelwert einer Gaußschen ist. Ich würde gerne wissen, ob es eine Möglichkeit gibt, solch eine Distribution von irgendeinem der Scikit-Modelle zu bekommen. Ich habe den Varianz-Score überprüft, konnte aber keinen Weg finden, ihn der Varianz zuzuordnen. Bitte helfen.Sklearn-Varianz für die lineare Regressionsvorhersage

Antwort

0

Wenn die Daten, die Sie anpassen, tatsächlich aus einem linearen Gaußschen Prozess stammen und der verwendete Stichprobensatz groß genug ist und durch Gaußsches Rauschen verfälscht wird, können Sie die Verteilung für die Vorhersagen aus R^erhalten 2 Koeffizient, der von der score() -Methode des linearen Regressionsobjekts zurückgegeben wird. R^2 ist 1 - (Varianz des Vorhersagefehlers)/(Varianz von y). Die Varianz der vorhergesagten Punkte ist also:

var(pred) = (1 - R^2) * var(y)