2016-04-06 6 views
2

Nach dem Erzeugen negativer binomial Daten mit Prob Set gleich .007 bekomme ich diese Zahl zurück von der Glm.nb() passen aber nur durch Betrug.Wie kann ich den Parameter "prob" aus glm.nb() entfernen?

library(MASS) 
counts<-data.frame(as.matrix(rnbinom(10000, prob = .007, size = 247))) 
names(counts)<-"y" 

head(counts) 

fitted_model<-glm.nb(y ~ 1, data = counts, link="identity") 

#Theta is the shape parameter of the negative binomial distribution. So this is "r". 
r<-theta.ml(fitted_model$y, fitted(fitted_model))[1]  
# the parameter r is referred to as the “dispersion parameter” or “shape parameter” 

mu<-coef(fitted_model) #This is the mean 

# mu=prob*r/(1-prob) according to https://en.wikipedia.org/wiki/Negative_binomial_distribution 
# so prob = 1/(r + mu) ? 
1/(r + mu) # Wrong! This isn't the prob I used to generate th data! 
r/(r + mu) # Right! But why does this get me the correct value of prob? 

#This has hints: http://www.wright.edu/~thaddeus.tarpey/ES714glm.pdf 

Ich möchte nicht schummeln, um den Wert von "prob" aus dem angepassten Modell zu erhalten. Kann jemand erklären, warum r/(r + mu) = prob?

Antwort

2

Wenn Sie Wikipedia-Definition

C(k+r-1,k) (1-p)^r p^k 

mit der Definition vergleichen gegeben in ?NegBinomial

Gamma(x+n)/(Gamma(n) x!) p^n (1-p)^x 

Sie werden sehen, dass die Rollen von p und 1-p geschaltet werden; Wenn wir NB als "Wahrscheinlichkeit von n Erfolgen, die vor einem Fehler auftreten" definieren, definiert Wikipedia als die Wahrscheinlichkeit des "Fehlers", während R p als die Wahrscheinlichkeit von "Erfolg" definiert. Ich bekomme das richtige Ergebnis von r/(r+mu) anstatt mu/(r+mu) ...

+0

Jetzt habe ich zwei Dinge gelernt: die Lösung für dieses Problem und die Regel, dass man immer die PDF-Formeln in beiden Systemen vergleichen sollte. – rwinkel2000