2016-05-05 20 views
0

Ich möchte meine Stichprobe in Stata 13 basierend auf drei Stratum Variablen mit insgesamt 12 Schichten (Größe - zwei Schichten; Sektor - drei Schichten; immaterielle Intensität - zwei Schichten) auswählen. Die Auswahl sollte ohne Ersatz proportional sein.Wie macht man proportionale geschichtete Stichproben ohne Ersatz?

Allerdings kann ich nur unverhältnismäßige Auswahlbefehle finden, die zum Beispiel x% jeder Schicht auswählen.

Kann mir jemand mit diesem Problem helfen?

+0

Was ist verhältnismäßig Probenahme außer in jeder Schicht die gleiche Fraktion der Auswahl? –

+0

Proportional bedeutet (zumindest von meinem Verständnis; bitte korrigieren Sie mich, wenn ich falsch liege) Sie wählen Themen in jeder Schicht basierend auf der Verteilung in der Bevölkerung, z. 35% der Bevölkerung sind große Unternehmen, also sollten am Ende 35% der großen Unternehmen in Ihrer Stichprobe sein. – Tobias

+0

In diesem Fall ist die Schichtung irrelevant. Ich denke, dass die Verwirrung hier ein statistischer Irrtum sein kann, dass eine Stichprobe eine Miniaturreplik der Bevölkerung sein soll. Suchen Sie eine Reihe von Arbeiten von Kruskal und Mosteller in _International Statistical Review_ 1979f. –

Antwort

0

Vielen Dank für diese Diskussion. Ich denke ich weiß wo mein Problem war.

Der Befehl "gsample" kann Schichten basierend auf verschiedenen Variablen auswählen. Daher dachte ich, ich müsste drei verschiedene Stratum-Variablen definieren. Aber die Lösung sollte einfacher sein.

Es gibt insgesamt 12 Schichten (die großen Firmen mit hoher Intensität in Sektor 1, die kleinen Firmen mit hoher Intensität in Sektor 1 usw.), wobei jedes Unternehmen in der Stichprobe in eine der Schichten fällt.

Alles, was ich tun muss, ist eine Variable "stradaident" mit Werten von 1 bis 12 zu erstellen, die die verschiedenen Schichten identifizieren. Ich tue dies für den Bevölkerungsdatensatz, also ist die Anzahl der Firmen, die in jede Schicht fallen, repräsentativ für die Bevölkerung. Der folgende Code liefert mir eine geschichtete Zufallsauswahl, die für die Bevölkerung repräsentativ ist.

gsample 10, percent strata (strataident) wor

Dieser Befehl auch und ist viel einfacher, siehe das Beispiel in 1 funktioniert:

gsample 10, percent wor strata(size sector intensity) 
+0

Schließen ist eine negative Aktion; Andernfalls bleiben alle Threads unbegrenzt offen, da andere möglicherweise je nach Reputation weitere Antworten hinzufügen (oder bearbeiten) möchten. Sie können Ihre eigene Antwort akzeptieren. http://stackoverflow.com/help/accepted-answer –

+0

Danke, ich werde es offen halten. – Tobias

+0

Siehe http://stackoverflow.com/help/closed-questions zu dem, was mit closing gemeint ist. –

-1

Das Problem ist, dass Schichten sich "überlappen" können. Sie müssen die Stichprobe wahrscheinlich nach dem ersten Entwurf neu ausgleichen.

Jetzt ist die Frage, wie dies umgesetzt werden kann. Die endgültige Stichprobe sollte den Anteil der Bevölkerung so gut wie möglich darstellen.

+0

Definitionsgemäß partitionieren Schichten in geschichtetem Stichprobenverfahren die Population und überschneiden sich nicht. –

+0

Was ich geschrieben habe, war falsch. Ich meinte, dass die Schichtung mehrdimensional ist und jedes Individuum Teil einer Schicht in jeder Dimension ist. – Marco