2016-04-19 5 views
9

Ich versuche, einzelne Datenrahmen von einem groupby zu trennen, um sie als pandas HTML-Tabellen zu drucken. Ich muss sie einzeln als Tabellen referenzieren und rendern, damit ich sie für eine Präsentation screenshot.Pandas: Wie man mehrere Datenrahmen als HTML-Tabellen referenziert und druckt

Dies ist meine aktuellen Code:

import pandas as pd 

df = pd.DataFrame(
    {'area': [5, 42, 20, 20, 43, 78, 89, 30, 46, 78], 
    'cost': [52300, 52000, 25000, 61600, 43000, 23400, 52300, 62000, 62000, 73000], 
    'grade': [1, 3, 2, 1, 2, 2, 2, 4, 1, 2], 'size': [1045, 957, 1099, 1400, 1592, 1006, 987, 849, 973, 1005], 
    'team': ['man utd', 'chelsea', 'arsenal', 'man utd', 'man utd', 'arsenal', 'man utd', 'chelsea', 'arsenal', 'arsenal']}) 

result = df.groupby(['team', 'grade']).agg({'cost':'mean', 'area':'mean', 'size':'sum'}).rename(columns={'cost':'mean_cost', 'area':'mean_area'}) 

dfs = {team:grp.drop('team', axis=1) 
     for team, grp in result.reset_index().groupby('team')} 

for team, grp in dfs.items(): 
    print('{}:\n{}\n'.format(team, gap)) 

Welche Drucke (als nicht HTML-Tabellen):

chelsea: 
    grade mean_cost mean_area size 
2  3  52000   42 957 
3  4  62000   30 849 

arsenal: 
    grade  mean_cost mean_area size 
0  1 62000.000000 46.000000 973 
1  2 40466.666667 58.666667 3110 

man utd: 
    grade mean_cost mean_area size 
4  1  56950  12.5 2445 
5  2  47650  66.0 2579 

Ist es möglich, diese Datenrahmen einzeln als HTML-Tabellen zu bekommen? Um Zweifel zu vermeiden, brauche ich keine iterative Methode, um sie alle als HTML-Tabellen in einem Schritt zurückzugeben - ich freue mich, jeden einzeln zu referenzieren.

Antwort

8

Als Thomas K points out, könnten Sie IPython.core.display.display verwenden, um die Anzeige von Datenrahmen zusammen mit print-Anweisungen in einem IPython Notebook zu übernehmen: hier

import pandas as pd 
from IPython.core import display as ICD 


df = pd.DataFrame(
    {'area': [5, 42, 20, 20, 43, 78, 89, 30, 46, 78], 
    'cost': [52300, 52000, 25000, 61600, 43000, 23400, 52300, 62000, 62000, 73000], 
    'grade': [1, 3, 2, 1, 2, 2, 2, 4, 1, 2], 'size': [1045, 957, 1099, 1400, 1592, 1006, 987, 849, 973, 1005], 
    'team': ['man utd', 'chelsea', 'arsenal', 'man utd', 'man utd', 'arsenal', 'man utd', 'chelsea', 'arsenal', 'arsenal']}) 

result = df.groupby(['team', 'grade']).agg({'cost':'mean', 'area':'mean', 'size':'sum'}).rename(columns={'cost':'mean_cost', 'area':'mean_area'}) 

dfs = {team:grp.drop('team', axis=1) 
     for team, grp in result.reset_index().groupby('team')} 

for team, grp in dfs.items(): 
    print(team) 
    ICD.display(grp) 

erzeugt
enter image description here

+2

Sie haben tatsächlich einen unnötigen Schritt - Sie sollten in der Lage sein, 'ICD.display (grp)' am Ende aufzurufen, um den reichhaltigen Ausdruck des Datenrahmens anzuzeigen. –

+1

@ThomasK: Vielen Dank für die Verbesserung! – unutbu