My-Datensatz wie folgt aussieht (nennen wir es data_xy
)R Codierung: Bootstrap einen Datensatz mit wiederholten Messungen
id X Y
1 5 10
1 6 11
1 4 8
2 3 9
2 3 12
3 4 10
...
Beobachtungen von insgesamt N-IDs. Jede ID hat mehrere Messreihen.
Ich möchte die ID mit Ersatz booten. Es ist sehr wahrscheinlich, dass die Bootstrap-ID Duplikate enthält.
b_idx <- sample.int(N,N,T)
ist es wahrscheinlich, dass
b_idx=c(1,1,3,4,4,4....)
Dann, wie mit b_idx
die Bootstrap-Probe zu schaffen? Wenn ich
data_xy[data_xy$id==b_idx,]
jeder id
(mit seinen wiederholten Messungen) werden nur diejenigen in meinem Bootstrap-Datensatz auftreten. Was ich wirklich will ist, die Beobachtungen für id=k
zu replizieren, wie oft diese ID in b_idx
auftritt. Wie kann ich das erreichen?