2009-04-26 2 views
3

Ich bin mir nicht sicher, ob diese Frage für Stack Overflow geeignet ist, aber ich werde es trotzdem versuchen. Ich habe einige Daten wie folgt: (. ZB 30% statt 17%)Statistische Schätzung Algorithmus

alt text

ich auch einen anderen Satz von Daten, die ich glaube, eine ähnliche Verteilung folgt, aber ich weiß, nur die Gesamt Prozent Kann jemand einen Algorithmus vorschlagen, um die% s für jede einzelne Stufe basierend auf der neuen Gesamtsumme und der ursprünglichen Verteilung zu schätzen?

+1

Das ist eine gute Frage für SO. Ich würde deinen Test jedoch bearbeiten und deine erste sentance entfernen. Die ersten paar Sentiments einer Frage werden als Tooltips oder Previews angezeigt, also sollten Sie auf die Formalitäten verzichten und direkt auf das Fleisch kommen. – JoshBerke

+0

Sollte die mögliche Summe fest bleiben? –

+0

Es ist mir nicht klar, was Sie zu tun versuchen. Ich werde versuchen, Ihre Frage zu beantworten, wenn Sie im Detail erklären können, was alle Ihre Messungen bedeuten, wie viele davon Sie haben und was genau Sie schätzen wollen. – simon

Antwort

1

Sie Frage ist unklar. Wenn Sie einen neuen Gesamtprozentsatz schätzen möchten, indem Sie die zusätzlichen Daten einschließen, die Sie erhalten, müssen Sie die Menge mit Ihrem Prozentsatz verknüpft haben, damit Sie einen gewichteten gewichteten Durchschnitt erstellen können.

Wenn Sie feststellen möchten, ob der neue Datensatz eine andere Verteilung als die historischen Daten hat, werden mehrere Tests durchgeführt, die meist stumpfe Berechnungen mit kumulativen tatsächlichen und erwarteten Prozentsätzen von Werten unter einem bestimmten Wert durchführen. Es gibt eine Menge Literatur zu dem Thema zum Vergleich der Verteilungen von zwei Populationen.

Für gepaarte Stichproben ist Wilcoxon-Rank eine Standardmethode, wenn Sie keine Annahmen über die Verteilung der Daten treffen können. Für nicht gepaarte Daten existieren non-parametric statistics, aber sie erfordern einige eingehende Studie.

1

Schritt-1: Wenn Ihr Gesamtprozentsatz 17% → 30%, dann Ist (Gesamt) 105 → ~ 189.

Schritt-2: Diese Anzahl aller Elemente in Spalte Ist verteilt werden muss

Von hier Dinge werden nicht-linear, und wir brauchen eine Formel für die von MÖGLICHE bei Actual ankommen. Und das muss eine Funktion des Ganzen sein.

d. H. Funktion (möglich, insgesamt (tatsächlich)) = tatsächlich.

Wenn wir die oben kommen können, dann könnte es funktionieren;)

+0

nicht wahr? Ich glaube, ich werde nicht etwas Grundlegendes bekommen. – ojblass

0

Wenn die neue Gesamt x ist, dann setzen (22/627) * x wie möglich für das Tier-1 und (21/627) * x wie aktuell für Stufe 1, die Ihnen den gleichen Prozentsatz wie vorher für Stufe 1 geben wird. Dann machen Sie dasselbe für die anderen Stufen (so möglich für Stufe 2 ist (45/627) * x, usw.).