Ich versuche, ein geeignetes Display zu finden, um verschiedene Eigenschaften innerhalb und zwischen Schulklassen zu veranschaulichen. Für jede Klasse gibt es nur 15-30 Datenpunkte (Schüler).Jitter wenn mehrere Ausreißer in ggplot2 boxplot
Gerade jetzt lehne ich mich an einen Whisker-losen Boxplot, nur 1., 2. und 3. Quartil + Datenpunkte mehr als z.B. 1 Population SD +/- der Stichprobenmedian.
Das kann ich tun.
Jedoch - ich muss diesen Graphen einigen Lehrern zeigen, um zu messen, was sie am meisten mögen. Ich möchte meinen Graphen mit einem normalen Boxplot vergleichen. Aber der normale Boxplot sieht genauso aus, wenn es nur einen Ausreißer gibt oder z.B. 5 Ausreißer bei gleichem Wert. In diesem Fall wäre dies ein Deal-Breaker.
z.B.
test <-structure(list(value = c(3, 5, 3, 3, 6, 4, 5, 4, 6, 4, 6, 4,
4, 6, 5, 3, 3, 4, 4, 4, 3, 4, 4, 4, 3, 4, 5, 6, 6, 4, 3, 5, 4,
6, 5, 6, 4, 5, 5, 3, 4, 4, 6, 4, 4, 5, 5, 3, 4, 5, 8, 8, 8, 8,
9, 6, 6, 7, 6, 9), places = structure(c(1L, 2L, 1L, 1L, 1L, 2L,
1L, 2L, 1L, 2L, 1L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 2L, 2L, 2L, 1L,
2L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 1L, 2L, 2L, 2L, 1L, 2L, 1L, 2L,
2L, 1L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 2L, 1L,
1L, 2L, 2L, 1L, 2L, 1L), .Label = c("a", "b"), class = "factor")), .Names = c("value",
"places"), row.names = c(NA, -60L), class = "data.frame")
ggplot(test, aes(x=places,y=value))+geom_boxplot()
Hier gibt es zwei Ausreißer bei ("a", 9) - aber nur ein "Punkt" angezeigt.
Also meine Frage: Wie man die Ausreißer jittert. Und - welche Art von Anzeige würden Sie für diese Art von Daten vorschlagen?
Das sieht gut aus! - Danke. Wie würde ich eine Unterklasse erstellen? Ich kann das nicht in hadleys Buch finden - und ich bin nicht passend in OOP :-) – Andreas
Ich lege ein Beispiel oben. – kohske
'build_accessor' muss jetzt durch' new' ersetzt werden (Stand Juni 2011), und 'GeomBoxplot' muss mit' ggplot2 ::: 'aufgerufen werden, ansonsten funktioniert das aber immer noch. Danke vielmals! – krlmlr