2013-10-14 13 views
5

Ich habe einige Probleme mit Coxph(). Ich habe zwei kategorische Variablen: Geschlecht und wahrscheinliche Ursache, die ich als Prädiktorvariablen verwenden möchte. Sex ist nur der typische Mann/Frau, aber wahrscheinliche Ursache hat 5 Optionen. Ich weiß nicht, was das Problem mit der Warnmeldung ist. Warum sind die Kofidenzintervalle von 0 bis Inf und die p-Werte so hoch?R coxph() Warnung: Loglik konvergierte vor Variable

Hier ist der Code und die Ausgabe:

> my_coxph <- coxph(Surv(tempo,status) ~ factor(Sexo)+ factor(Causa.provavel) ,   data=ceabn) 
Warning message: 
In fitter(X, Y, strats, offset, init, control, weights = weights, : 
Loglik converged before variable 2,3,5,6 ; beta may be infinite. 

> summary(my_coxph) 
Call: 
coxph(formula = Surv(tempo, status) ~ factor(Sexo) + factor(Causa.provavel), 
data = ceabn) 

n= 43, number of events= 31 

              coef exp(coef) se(coef)  z Pr(>|z|) 
factor(Sexo)macho      7.254e-01 2.066e+00 4.873e-01 1.488 0.137 
factor(Causa.provavel)caca    2.186e+01 3.107e+09 9.698e+03 0.002 0.998 
factor(Causa.provavel)colisao linha MT 1.973e+01 3.703e+08 9.698e+03 0.002 0.998 
factor(Causa.provavel)indeterminado 9.407e-01 2.562e+00 1.683e+04 0.000 1.000 
factor(Causa.provavel)predacao   2.170e+01 2.655e+09 9.698e+03 0.002 0.998 
factor(Causa.provavel)predado   2.276e+01 7.659e+09 9.698e+03 0.002 0.998 

             exp(coef) exp(-coef) lower .95 upper .95 
factor(Sexo)macho      2.065e+00 4.841e-01 0.7947  5.368 
factor(Causa.provavel)caca    3.107e+09 3.219e-10 0.0000  Inf 
factor(Causa.provavel)colisao linha MT 3.703e+08 2.701e-09 0.0000  Inf 
factor(Causa.provavel)indeterminado 2.562e+00 3.904e-01 0.0000  Inf 
factor(Causa.provavel)predacao   2.655e+09 3.766e-10 0.0000  Inf 
factor(Causa.provavel)predado   7.659e+09 1.306e-10 0.0000  Inf 

Concordance= 0.752 (se = 0.059) 
Rsquare= 0.608 (max possible= 0.987) 
Likelihood ratio test= 40.23 on 6 df, p=4.105e-07 
Wald test   = 7.46 on 6 df, p=0.2807 
Score (logrank) test = 30.48 on 6 df, p=3.183e-05 

Danke

Antwort

8

Als ich Terry Therneau (Autor von pkg: Überleben) fragte nach, dass vor einigen Jahren, sagte er der Test, der ausgelöst wird, generieren Sie diese Warnung ist übermäßig empfindlich. Im Allgemeinen ist die Warnung nicht korrekt. Sie können in der Regel nur Ihre Koeffizienten betrachten, um zu sehen, dass sie nicht unendlich sind

In Ihrem Fall scheint es jedoch, Sie richtig zu warnen, dass es möglicherweise Probleme mit Ihren Daten gibt, da Sie unplausibel große Koeffizienten haben. Ein Beta-Koeffizient von 2,276e + 01 (= 22,7) in einem Exponentialmodell ist nur lächerlich hoch. Das geschätzte relative Risiko liegt bei weit über einer Million! Sie sollten tabellarische Klassifikationen Ihrer Daten für Probleme der vollständigen Trennung betrachten. Hat irgendeine Ihrer Kontrollgruppe gestorben, äh, haben Sie eine Veranstaltung?

+0

Ich habe 31 Ereignisse in 43. Aber ich denke, du hast Recht, ich hatte Daten vermasselt. – JMarcelino