Nach dem Erzeugen negativer binomial Daten mit Prob Set gleich .007 bekomme ich diese Zahl zurück von der Glm.nb() passen aber nur durch Betrug.Wie kann ich den Parameter "prob" aus glm.nb() entfernen?
library(MASS)
counts<-data.frame(as.matrix(rnbinom(10000, prob = .007, size = 247)))
names(counts)<-"y"
head(counts)
fitted_model<-glm.nb(y ~ 1, data = counts, link="identity")
#Theta is the shape parameter of the negative binomial distribution. So this is "r".
r<-theta.ml(fitted_model$y, fitted(fitted_model))[1]
# the parameter r is referred to as the “dispersion parameter” or “shape parameter”
mu<-coef(fitted_model) #This is the mean
# mu=prob*r/(1-prob) according to https://en.wikipedia.org/wiki/Negative_binomial_distribution
# so prob = 1/(r + mu) ?
1/(r + mu) # Wrong! This isn't the prob I used to generate th data!
r/(r + mu) # Right! But why does this get me the correct value of prob?
#This has hints: http://www.wright.edu/~thaddeus.tarpey/ES714glm.pdf
Ich möchte nicht schummeln, um den Wert von "prob" aus dem angepassten Modell zu erhalten. Kann jemand erklären, warum r/(r + mu) = prob?
Jetzt habe ich zwei Dinge gelernt: die Lösung für dieses Problem und die Regel, dass man immer die PDF-Formeln in beiden Systemen vergleichen sollte. – rwinkel2000