2016-08-02 46 views
2

Ich habe Datenrahmen Blick mag dies:Pandas Zeitreihen Datenvorverarbeitung

> dt 
    text timestamp 
0 a 2016-06-13 18:00 
1 b 2016-06-20 14:08 
2 c 2016-07-01 07:41 
3 d 2016-07-11 19:07 
4 e 2016-08-01 16:00 

Und ich möchte, wie jeden Monat die Daten zusammenfassen: kann

> dt_month 
count timestamp 
0 2 2016-06 
1 2 2016-07 
2 1 2016-08 

die ursprünglichen Daten-Set (dt) erzeugt werden durch :

import pandas as pd 
data = {'text': ['a', 'b', 'c', 'd', 'e'], 
    'timestamp': ['2016-06-13 18:00', '2016-06-20 14:08', '2016-07-01 07:41', '2016-07-11 19:07', '2016-08-01 16:00']} 
dt = pd.DataFrame(data) 

Und gibt es Möglichkeiten, ein Zeit-Frequenz-Diagramm vonplotten?

Antwort

1

Sie können timestamp Spalte GROUPBY umgewandelt to_period und Aggregat size:

print (df.text.groupby(df.timestamp.dt.to_period('m')) 
       .size() 
       .rename('count') 
       .reset_index()) 

    timestamp count 
0 2016-06  2 
1 2016-07  2 
2 2016-08  1