Ich habe einen Datenrahmen wie folgt.Pandas: Wie Zeilen extrahiert werden, die gerade innerhalb einer Zeitdauer sind?
value estimated \
dttm_timezone
2011-12-31 20:10:00 10.7891 0
2011-12-31 20:15:00 11.2060 0
2011-12-31 20:20:00 19.9975 0
2011-12-31 20:25:00 15.9975 0
2011-12-31 20:30:00 10.9975 0
2011-12-31 20:35:00 13.9975 0
2011-12-31 20:40:00 15.9975 0
2011-12-31 20:45:00 11.7891 0
2011-12-31 20:50:00 10.9975 0
2011-12-31 20:55:00 10.3933 0
Durch die Informationen dttm_timezone Spalte, würde Ich mag alle Zeilen extrahieren, die nur innerhalb eines Tag oder eine Woche oder einem Monat.
Ich habe Daten von 1 Jahr, also wenn ich Tag wie die Dauer wähle ich separat 365 Tage Daten extrahieren soll, wenn ich Monat wählen dann sollte ich separat ein 12 Monate Daten extrahieren.
Wie kann ich das erreichen?
/@ Haggar Was haben Sie versucht? – Merlin
Können Sie das konkretisieren „extrahieren Sie alle Zeilen, die nur innerhalb eines Tages sind“ Haben Sie meinen Sie möchten einen Tag specificy und alle Zeilen raus, die an jenem Tag,? Oder meinst du, du willst die Daten neu indizieren, so dass ihre Häufigkeit Täglich ist? Im letzteren Fall, wie möchten Sie die Werte aggregieren? Nimm das Maximum? Der Mittelwert? et cetera –
@MerIin: Ich weiß, dass die Proben alle 5 Minuten gesammelt werden, so habe ich berechnet, wie viele Zeilen es dauert einen Tag und einen Monat. Ich bin besorgt, dass, wenn sich die Sampling-Zeit ändert, es nicht funktioniert, also war ich nur neugierig zu wissen, ob es einen Weg gibt, es mit Pandas-Funktionen zu machen. Ich dachte über Resample nach. – HaggarTheHorrible