ich SciPy in Python bin mit und dem folgend für einen nan
Wert zurückgeben welchen Grund auch immer:Warum gibt SciPy `nan` für einen t-Test mit Stichproben mit 0 Varianz zurück?
>>>stats.ttest_ind([1, 1], [1, 1])
Ttest_indResult(statistic=nan, pvalue=nan)
>>>stats.ttest_ind([1, 1], [1, 1, 1])
Ttest_indResult(statistic=nan, pvalue=nan).
Aber immer, wenn ich Samples verwenden, die unterschiedlichen Auswertungsstatistiken haben, bekomme ich tatsächlich einen angemessenen Wert:
stats.ttest_ind([1, 1], [1, 1, 1, 2])
Ttest_indResult(statistic=-0.66666666666666663, pvalue=0.54146973927558495).
Ist es sinnvoll, stattdessen einen p-Wert von nan
als 0
zu interpretieren? Gibt es einen Grund für die Statistik, dass es keinen Sinn macht, einen 2-Stichproben-t-Test für Stichproben mit derselben Summenstatistik durchzuführen?
Ich denke, dass das Problem ist, dass ttests eine Division durch die Standardabweichung enthalten. Ich würde stattdessen überprüfen, ob die Standardabweichung 0 ist, weil es andere Fälle geben kann, in denen es Nan zurückgibt (nicht sicher, was sie sein würden) –