2016-04-21 13 views
2

Ich versuche, die Null-Verteilung in einer Chi-Quadrat-test.In R grafisch darzustellen es möglich ist, Monte Carlo Simulation zu tun, um den empirischen p-Wert mit dem Code zu erhalten:Abrufen der Monte-Carlo-Simulationswerte für Chi-Quadrat-Test

chisq.test(d,simulate.p.value=TRUE,B=10000) 

Aber es gibt das Verteilungsdiagramm nicht zurück. Gibt es eine Möglichkeit, R zu veranlassen, die simulierten Werte für den Test zurückzugeben?

Antwort

2

Wenn Sie bei der Definition der Funktion sucht chisq.test (um die Linie 56 von capture.output(chisq.test)) Sie an die Simulationsabschnitt kommen werde:

if (simulate.p.value && all(sr > 0) && all(sc > 0)) { 
     setMETH() 
     tmp <- .Call(C_chisq_sim, sr, sc, B, E) 
     STATISTIC <- sum(sort((x - E)^2/E, decreasing = TRUE)) 
     PARAMETER <- NA 
     PVAL <- (1 + sum(tmp >= almost.1 * STATISTIC))/(B + 
      1) 
    } 

Dies ist eine C-Funktion aufrufen. Zuerst erzeugen einige Dummy-Daten

## Some data 
x <- as.table(rbind(c(762, 327, 468), c(484, 239, 477))) 
dimnames(x) <- list(gender = c("F", "M"), 
       party = c("Democrat","Independent", "Republican")) 

dann das Bit greifen, dass Sie

brauchen
sr <- rowSums(x) 
sc <- colSums(x) 
n <- sum(x) 
E <- outer(sr, sc, "*")/n 
v <- function(r, c, n) c * r * (n - r) * (n - c)/n^3 
V <- outer(sr, sc, v, n) 
dimnames(E) <- dimnames(x) 
B = 2000 
tmp <- .Call(stats:::C_chisq_sim, sr, sc, B, E) 
STATISTIC <- sum(sort((x - E)^2/E, decreasing = TRUE)) 
almost.1 <- 1 - 64 * .Machine$double.eps             
PVAL <- (1 + sum(tmp >= almost.1 * STATISTIC))/(B + 1) 

Die Variable tmp die Ausgabe enthält, die Sie wollen. Die variablen PVAL stimmt mit der Ausgabe von

chisq.test(x, simulate.p.value = T, B=2000)$p.value 

Hinweis ich verwendet habe ::: da die Funktion C_chisq_sim nicht von Statistiken exportiert.