2009-10-29 6 views
13

Ich benutze ggplot2, um Histogramm-Panels zu erstellen, und ich möchte eine vertikale Linie im Mittel jeder Gruppe hinzufügen können. Aber geom_vline() verwendet die gleiche Intercept für jede Platte (das heißt die globalen Mittel):Fügen Sie für jedes Panel in ggplot2 eine vertikale Linie mit unterschiedlichem Schnittpunkt hinzu.

require("ggplot2") 
# setup some sample data 
N <- 1000 
cat1 <- sample(c("a","b","c"), N, replace=T) 
cat2 <- sample(c("x","y","z"), N, replace=T) 
val <- rnorm(N) + as.numeric(factor(cat1)) + as.numeric(factor(cat2)) 
df <- data.frame(cat1, cat2, val) 

# draws a single histogram with vline at mean 
qplot(val, data=df, geom="histogram", binwidth=0.2) + 
    geom_vline(xintercept=mean(val), color="red") 

# draws panel of histograms with vlines at global mean 
qplot(val, data=df, geom="histogram", binwidth=0.2, facets=cat1~cat2) + 
    geom_vline(xintercept=mean(val), color="red") 

Wie kann ich es bekomme jede Gruppe als den x-Schnittpunkt bedeutet Panel-benutzen? (Bonuspunkte, wenn Sie auch eine Textbeschriftung um die Zeile mit dem Wert des Mittelwerts hinzufügen können.)

Antwort

9

Eine Möglichkeit besteht darin, das data.frame mit den Mittelwerten vorher zu erstellen.

library(reshape) 
dfs <- recast(data.frame(cat1, cat2, val), cat1+cat2~variable, fun.aggregate=mean) 
qplot(val, data=df, geom="histogram", binwidth=0.2, facets=cat1~cat2) + geom_vline(data=dfs, aes(xintercept=val), colour="red") + geom_text(data=dfs, aes(x=val+1, y=1, label=round(val,1)), size=4, colour="red") 
13

Ich denke, das ist eine Überarbeitung von @ Eduardo ist wirklich, aber in einer Zeile.

ggplot(df) + geom_histogram(mapping=aes(x=val)) 
    + geom_vline(data=aggregate(df[3], df[c(1,2)], mean), 
     mapping=aes(xintercept=val), color="red") 
    + facet_grid(cat1~cat2) 

alt text http://www.imagechicken.com/uploads/1264782634003683000.png

oder mit plyr (require(plyr) ein Paket vom Autor ggplot, Hadley):

ggplot(df) + geom_histogram(mapping=aes(x=val)) 
    + geom_vline(data=ddply(df, cat1~cat2, numcolwise(mean)), 
     mapping=aes(xintercept=val), color="red") 
    + facet_grid(cat1~cat2) 

Es scheint, dass unbefriedigende vline nicht auf den Facetten geschnitten wird, I‘ Ich bin mir nicht sicher warum.