Diese meine Daten (man stelle ich habe 1050 Zeilen von Daten weiter unten)Benötigen Sie Hilfe Auswertungsstatistiken für R-Datenrahmen immer
ID_one ID_two parameterX
111 aaa 23
222 bbb 54
444 ccc 39
Mein Code dann die Zeilen in Gruppen von 100 wird unterteilen (es wird 10 sein Gruppen von 100 Zeilen).
Ich möchte dann die zusammenfassende Statistik pro Gruppe erhalten. (funktioniert nicht) Danach möchte ich die Zusammenfassung Statistiken in einem Datenrahmen platzieren, um sie zu plotten.
Zum Beispiel setzen alle 10 Mittel zum parameterX in einem Datenrahmen zusammen, setzen alle 10 std dev für parameterX in demselben Datenrahmen zusammen etc Der folgende Code funktioniert nicht:
#assume data is available
dataframe_size <- nrow(thedata)
group_size <- 100
number_ofgroups <- round(dataframe_size/group_size)
#splitdata into groups of 100
split_dataframe_into_groups <- function(x,y)
0:(x-1) %% y
list1 <- split(thedata, split_dataframe_into_groups(nrow(thedata), group_size))
#print data in the first group
list1[[1]]$parameterX
#NOT WORKING!!! #get summary stat for all 10 groups
# how to loop through all 10 groups?
list1_stat <- do.call(data.frame, list(mean = apply(list1[[1]]$parameterX, 2, mean),
sd = apply(list1[[1]]$parameterX, 2, sd). . .))
der Fehler Nachricht ist immer:
Fehler gelten (...) dim (x) eine positive Länge haben müssen , die keinen Sinn macht, denn wenn ich diesen Code ausführen, gibt eindeutig eine positive Länge (Daten vorhanden)
#print data in the first group
list1[[1]]$parameterX
#how to put all means in a dataframe?
# how to put all standard deviations in the same dataframe
ex df1 <- mean(2,2,3,4,7,2,4,,9,8,9),
sd (0.1, 3 , 0.5, . . .)
Funktioniert dies für Ihren Code: 't (sapply (list1, Funktion (x) c (Mittelwert = Mittelwert (x $ ParameterX), SD = SD (x $ ParameterX))))'? – Raad
Erstellen Sie die Gruppen basierend auf der Zeilennummer oder basierend auf ID1 oder ID2? –
es basiert auf Zeilennummer. Ex-Zeilen 1-100 sind in Gruppe 1, Zeilen 101-201 werden in Gruppe 2 usw. –