ich einen Datenrahmen haben df
genannt:Warum funktioniert die Funktion top_n() von dplyr nicht?
City,State,Price,Dogs
Portland,OR,75,1
Portland,OR,100,3
San Diego,CA,12,4
San Diego,CA,23,5
...
I dplyr
‚s summarise
und group_by
Funktionen ...
df.median <- summarise(
group_by(
df,
State,
City
),
MEDIAN_PRICE = median(Price),
SUM_DOGS = sum(Dogs)
)
verwendet Aber wenn ich top_n(df.median, 100, SUM_DOGS)
ausführen, wird R Städten mit der 100 geben Sie mir nicht höchste Werte in SUM_DOGS
. Es gibt nur df.median
zurück.
Warum?
Was gibt es zurück? –
@MekkiMacAulay Bearbeitete Antwort – Username
Wenn Sie nicht die oberen 100 Werte pro 'State' wollen, müssen Sie wahrscheinlich' ungroup'. – aosmith