2016-07-26 12 views
2

Wie kann ich den Standardfehler für eine binäre Variable mit R berechnen? Ich habe eine Gruppe von Teilnehmern, die eine Aufgabe über mehrere Bedingungen hinweg durchführen. Die Ausgabe könnte 0 (falsch) oder 1 (korrekt) sein. Ich habe den mittleren Anteil der richtigen Antworten und Standardfehler (SE) im nächsten berechnet:Standardfehler Binärvariable R

mean<-tapply(dataRsp$Accuracy, dataRsp$Condition, FUN=mean) 

SE<- with(dataRsp, tapply(Accuracy, Condition, sd)/sqrt(summary(dataRsp$Condition))) 

Aber die SE ist extremelly fest, dass sie kaum richtig sein können. Könnte mir jemand ein paar Ideen? Fand ich, dass die nächste könnte die Lösung sein,

sqrt(p.est*(1-p.est)/n) 

... aber ich weiß nicht, wie es

Antwort

2

Angenommen R. zu implementieren, die für variable X gibt es nur 2 Ergebnisse (0/1) und wir gehen davon aus, dass die Erfolgschance (1) gleich p ist. Dies bedeutet, dass X eine Bernoulli (p) Verteilung folgt.

Der Mittelwert und die Varianz werden dann durch p und p * (1-p)/n, da wo n Ihre Probengröße p Jetzt ändern von p.est, wo p.est ist die Proportionen der richtigen Antworten.

Also, wenn Sie eine Variable binary mit 1'en für Erfolge und 0 für Ausfälle genannt:

p.est <- mean(binary) 
variance <- (p.est*(1-p.est))/nrow(binary) 
std.dev <- sqrt(variance) 

EDIT:

Sie haben auch gesagt, dass Sie sehr kleine SE gefunden, der die Zähler waren intuitiv . Schauen wir uns die Formel für die Varianz genauer an: p * (1-p)/n. Der größte Wert, den der Zähler (p * (1-p)) annehmen kann, beträgt nur 0,25, d. H. Wenn p = 0,5. Dieser Wert kann nur abnehmen, da wir ihn durch n (die Anzahl der Beobachtungen) teilen. Angenommen, wir haben p = 0,5 und n = 100, dann beträgt die Varianz nur 0,0025. Um die SE zu finden, nehmen wir die Quadratwurzel, die in diesem Beispiel eine SE von 0,05 ergibt. Wenn Sie mehr Beobachtungen haben, d. H. n> 100 werden die Varianz und SE nur noch mehr abnehmen (Intuition: mehr Daten => mehr Sicherheit => kleinere Varianz/SE).

Wenn die Formel für die Varianz/SE so erklärt wird, ist es immer noch seltsam, dass Sie kleine SE haben?

+0

Vielen Dank für Ihre Hilfe. Das Codewort gut, aber ich bekomme einen Wert von 0,006, der für mich keinen Sinn ergibt. Bei einer durchschnittlichen Genauigkeit von beispielsweise 85% sollte die erwartete SE viel grßer sein. Nicht sicher, was der Grund sein könnte – user3596790

+0

Danke Marcel. Dies war sehr klärend. (p * (1-p)) = 0,13 n = 3290, die Varianz ist sehr niedrig, und deshalb erhalte ich SE = 0,006. Ich dachte, es wäre kontraproduktiv, aber wenn ich mich dem großen n widme, könnte es einen Sinn ergeben. Vielen Dank. – user3596790

+0

@ user3596790 Glücklich zu helfen! Wenn Ihre Frage vollständig beantwortet wurde, aktivieren Sie das Kontrollkästchen unter den Aufwärts-/Abwärtspfeilen – Marcel10