Ich habe einen Datenrahmen, der wie folgt aussieht:Warum funktioniert mein dplyr group_by & summary nicht richtig? (Name-Kollision mit plyr)
#df
ID DRUG FED AUC0t Tmax Cmax
1 1 0 100 5 20
2 1 1 200 6 25
3 0 1 NA 2 30
4 0 0 150 6 65
Am so weiter. Ich möchte einige Statistiken über AUC, Tmax und Cmax nach Medikament DRUG
und FED STATUS FED
zusammenfassen. Ich benutze dplyr. Beispiel: für die AUC:
CI90lo <- function(x) quantile(x, probs=0.05, na.rm=TRUE)
CI90hi <- function(x) quantile(x, probs=0.95, na.rm=TRUE)
summary <- df %>%
group_by(DRUG,FED) %>%
summarize(mean=mean(AUC0t, na.rm=TRUE),
low = CI90lo(AUC0t),
high= CI90hi(AUC0t),
min=min(AUC0t, na.rm=TRUE),
max=max(AUC0t,na.rm=TRUE),
sd= sd(AUC0t, na.rm=TRUE))
Der Ausgang ist jedoch nicht nach DRUG und FED gruppiert. Es gibt nur eine Zeile mit den Statistiken von allen, die auf DRUG und FED nicht facettiert sind.
Irgendeine Idee warum? und wie kann ich es dazu bringen, das Richtige zu tun?
Bitte überprüfen Sie diesen Link http://stackoverflow.com/questions/21653295/dplyr-issues-with-group-by – akrun
@akrun Vielen Dank. Ich war eigentlich glücklich mit dem dplyr-Paket, aber es sieht so aus, als wäre es nicht zuverlässig! – Amer
BTW, sollten Sie nicht Ihre Funktionen als CI95hi und CI95lo bezeichnen, also mit 95 statt mit 90? – rnso