Wie kann ich einen Datenrahmen durch einige Variablen zusammenbrechen, wobei Mittelwert über andere

Ich muss einen Datenrahmen durch einige Variablen zusammenfassen und die anderen ignorieren. Dies wird manchmal als Kollaps bezeichnet. Z.B. wenn ich einen Datenrahmen wie dieses:Wie kann ich einen Datenrahmen durch einige Variablen zusammenbrechen, wobei Mittelwert über andere

Widget Type Energy 
egg 1 20 
egg 2 30 
jap 3 50 
jap 1 60

Dann durch Widget kollabiert, mit Energie die abhängige Variable, Energie ~ Widget, ergäbe

Widget Energy 
egg 25 
jap 55

In Excel die nächste Funktionalität könnte "Pivot-Tabellen" sein und ich habe herausgefunden, wie es in Python (http://alexholcombe.wordpress.com/2009/01/26/summarizing-data-by-combinations-of-variables-with-python/) zu tun, und hier ist ein Beispiel mit R mit DoBy-Bibliothek, um etwas sehr ähnliches zu tun (http://www.mail-archive.com/[email protected]/msg02643.html), aber gibt es eine einfache Möglichkeit, das oben zu tun? Und noch besser ist irgendetwas in die ggplot2-Bibliothek eingebaut, um Diagramme zu erstellen, die über einige Variablen hinweg kollabieren?

Quelle

2010-04-01 Alex Holcombe

Verwenden aggregate über einen Faktor zusammenfassen:

> df<-read.table(textConnection(' 
+ egg 1 20 
+ egg 2 30 
+ jap 3 50 
+ jap 1 60')) 
> aggregate(df$V3,list(df$V1),mean) 
    Group.1 x 
1  egg 25 
2  jap 55

Für mehr Flexibilität Blick auf die tapply Funktion und der plyr Paket.

In ggplot2 Verwendung stat_summary zusammenzufassen

qplot(V1,V3,data=df,stat="summary",fun.y=mean,geom='bar',width=0.4)

Quelle

2010-04-01 05:40:29

'gibt by' auch praktisch ist, von Zeit zu Zeit. –

wahr. auch 'ave' –

für ein Beispiel mit' ddply' aus dem 'plyr' Paket werfen Sie einen Blick auf diese verwandte Frage: http://stackoverflow.com/questions/2473659/r-what-are-the-best-functions- to-Deal-with-concatenating-und-Averaging-Werte-in – mropa

Für vertraut die mit SQL, einem anderen Art und Weise Datenrahmen zu manipulieren, kann der sqldf Befehl in dem sqldf Paket sein.

Quelle

2012-06-01 06:55:41 BlueCoder

@Jyotiirmoy erwähnt, dass dies mit der Bibliothek plyr getan werden kann. Hier ist, was das aussehen würde:

DF <- read.table(text= 
"Widget Type Energy 
egg 1 20 
egg 2 30 
jap 3 50 
jap 1 60", header=TRUE) 

library("plyr") 
ddply(DF, .(Widget), summarise, Energy=mean(Energy))

die

> ddply(DF, .(Widget), summarise, Energy=mean(Energy)) 
    Widget Energy 
1 egg  25 
2 jap  55

Quelle

2012-06-01 16:57:25

Wie kann ich einen Datenrahmen durch einige Variablen zusammenbrechen, wobei Mittelwert über andere

Antwort

Verwandte Themen