mit dieser meine Dummy-Daten ist:Wie Daten von Clustern (Block Sampling) mit Ersatz in R Resampling Sampling Paket
income <- as.data.frame.vector <- sample(1000:10000, 1000, replace=TRUE)
individuals <- as.data.frame.vector <- sample(1:50,1000,replace=TRUE)
datatest <- as.data.frame (cbind (income, individuals))
Ich weiß, dass ich von den einzelnen Zeilen mit diesem Code probieren kann:
sample <- datatest[sample(nrow(datatest), replace=TRUE),]
Nun möchte ich Stichproben mit Ersatz und gleichen Wahrscheinlichkeiten des Datensatzes extrahieren, aber komplette Blöcke von Beobachtungen mit dem gleichen individuellen Code probieren. Beachten Sie, dass es 50 Personen gibt, aber 1000 Beobachtungen. Einige Beobachtungen gehören demselben Individuum an, daher möchte ich nach Individuen (in diesem Fall Cluster) und nicht nach Beobachtungen suchen. Es macht mir nichts aus, wenn die extrahierten Proben sich geringfügig in der Anzahl der Beobachtungen unterscheiden. Wie kann ich das machen?
Ich habe versucht:
library(sampling)
samplecluster <- cluster (datatest, clustername=c("individuals"), size=50,
method="srswr")
Aber das Ergebnis ist nicht die abgetasteten Daten. Fehle ich etwas?
Mögliches Duplikat hilfreich sein [Randomly ausgewählter Gruppen (und alle Fälle pro Gruppe) in R?] (Http://stackoverflow.com/questions/13214769/randomly-select- Gruppen-und-alle-Fälle-pro-Gruppe-in-r) – Bulat
Gerade realisierte, dass dies ein sehr häufiges Problem sein muss, fand eine sehr ähnliche Frage. – Bulat
Ja, Sie haben Recht, es ist das gleiche Problem. Ich werde die Frage jedoch hinterlassen, falls jemand sie mit diesen Bedingungen durchsucht. Neben Ihrer Antwort und den Antworten auf die andere Frage stelle ich Ihnen im Folgenden eine alternative Antwort unter Verwendung des Sampling-Pakets zur Verfügung. –