2016-07-31 26 views
0

Daten: "https://github.com/estimate/pandas-exercises/blob/master/baby-names2.csv"
In Pandas:
Drucke Datenrahmen nach Gruppierung H2o Python

df=pd.read_csv("baby-names2.csv") 
df_group=df.groupby("year") 
print df_group.head() 

Es druckt den Datenrahmen nach Jahr gruppiert.
Wie mache ich das gleiche in H2o Python?
In H2o:

df=h2o.upload_file("baby-names2.csv") 
df_group=df.group_by("year") 
print df_group.head() ==> gives Error 

Erwartete Ausgabe:
http://i.imgur.com/VTbMX9w.png

Antwort

0

einen h2o Rahmen zu erhalten, nachdem Sie groupby() verwenden .get_frame() verwendet haben, die das Ergebnis der Gruppe-by zurückgibt. Zum Beispiel, wenn Sie die Zählung für jedes Jahr erhalten wollten könnten Sie tun:

df=h2o.import_file("baby-names2.csv") 
df_group=df.group_by("year").count() 
df_group.get_frame() 

which prints the year and count columns.

+0

Eigentlich wollte ich so etwas. http://i.imgur.com/VTbMX9w.png –

+0

suchen Sie nur nach einer Möglichkeit, Ihre Daten zu sortieren? – Lauren

+0

ja. Ich möchte nur meine Daten nach Jahren organisieren. das gleiche wie das, das ich angehängt habe –