Ich habe eine relativ kleine (~ 100 Werte) Menge von ganzen Zahlen: jede von ihnen stellt dar, wie viel Zeit (in Millisekunden) ein Test dauerte ich dauerte.Berechnung des tatsächlichen Durchschnittswerts
Der triviale Algorithmus zur Berechnung des Durchschnitts besteht darin, alle n
Werte zusammenzufassen und das Ergebnis durch n
zu teilen, aber dies berücksichtigt nicht, dass ein lächerlich hoher/niedriger Wert falsch sein muss und verworfen werden sollte.
Welche Algorithmen sind verfügbar, um den tatsächlichen Durchschnittswert zu schätzen?
Es gibt nicht so etwas wie die „tatsächlichen“ Mittelwert: Sie können nicht streng statistischen Ausreißer von den tatsächlichen Daten unterscheiden, ohne dass einige Annahmen zu machen. Was tatsächliche Daten und was Fehler sind, ist letztlich eine probabilistische Entscheidung. Auch das ist keine Programmierfrage, sondern eine Frage der Statistik. – stakx
+1 stakx. Außerdem könnte ich vorschlagen, dass die Annahme, dass "lächerliche" Werte "falsch" sind, falsch sein könnte. Ich würde vorschlagen, einfach weitere Tests (1000 oder 10000) zu starten und den * Mittelwert * -Wert unverändert zu nehmen. –