2013-01-03 2 views
5

Angenommen, wir haben einen Datenrahmen oder eine Matrix mit einer Spalte, die einen ganzzahligen Wert N wie folgt angibt (Spalte 5). Gibt es einen Vektoransatz, um das Objekt neu zu bevölkern, so dass jede Zeile N-mal kopiert wird?Methode zum Kopieren von Zeilen R

> y 
      [,1]  [,2]  [,3]  [,4] [,5] 
[1,] -0.02738267 0.5170621 -0.01644855 0.48830663 1 
[2,] -0.30076544 1.8136359 0.02319640 -1.59649330 2 
[3,] 1.73447245 0.4043638 -0.29112385 -0.25102988 3 
[4,] 0.01025271 -0.4908636 0.80857300 0.08137033 4 

Das Ergebnis wäre wie folgt.

[1,] -0.02738267 0.5170621 -0.01644855 0.48830663 1 
[2,] -0.30076544 1.8136359 0.02319640 -1.59649330 2  
[2,] -0.30076544 1.8136359 0.02319640 -1.59649330 2 
[3,] 1.73447245 0.4043638 -0.29112385 -0.25102988 3 
[3,] 1.73447245 0.4043638 -0.29112385 -0.25102988 3 
[3,] 1.73447245 0.4043638 -0.29112385 -0.25102988 3 
[4,] 0.01025271 -0.4908636 0.80857300 0.08137033 4 
[4,] 0.01025271 -0.4908636 0.80857300 0.08137033 4 
[4,] 0.01025271 -0.4908636 0.80857300 0.08137033 4 
[4,] 0.01025271 -0.4908636 0.80857300 0.08137033 4 

Eine andere Frage wäre, wie die neu bevölkerten Zeilen Jitter, so dass es nicht Überlappung der neu kopierten Daten berechnen ist.

Antwort

7

Einige erfundenen Daten:

y <- cbind(matrix(runif(16), 4, 4), 1:4) 

Just do:

z <- y[rep(seq_len(nrow(y)), y[,5]), ] 
#   [,1]  [,2]  [,3]  [,4] [,5] 
# [1,] 0.5256007 0.07467979 0.95189484 0.2887943 1 
# [2,] 0.3083967 0.03518523 0.08380005 0.9168161 2 
# [3,] 0.3083967 0.03518523 0.08380005 0.9168161 2 
# [4,] 0.8549639 0.79452728 0.22483537 0.4452553 3 
# [5,] 0.8549639 0.79452728 0.22483537 0.4452553 3 
# [6,] 0.8549639 0.79452728 0.22483537 0.4452553 3 
# [7,] 0.5453508 0.47633523 0.51522514 0.3936340 4 
# [8,] 0.5453508 0.47633523 0.51522514 0.3936340 4 
# [9,] 0.5453508 0.47633523 0.51522514 0.3936340 4 
# [10,] 0.5453508 0.47633523 0.51522514 0.3936340 4 

Und ich bin nicht sicher, was Sie unter "Jitter" bedeuten, aber vielleicht

z <- z + runif(z)/1000 

?

+0

perfekt. Jitter ist nur die neu belegten Zeilen (minus der N-Spalte) und fügen ein wenig Rauschen hinzu, so dass sie keine perfekten Kopien sind. Ich nehme an, dass das Hinzufügen einer Funktion, wie Sie gezeigt haben, ein guter Anfang ist. – pat