Angenommen, ich habe ein Datenformat von Zeitstempeln mit der entsprechenden Anzahl der zu diesem Zeitpunkt verkauften Tickets.Verwenden eines rollenden Zeitintervalls zum Zählen von Zeilen in R und dplyr
Timestamp ticket_count
(time) (int)
1 2016-01-01 05:30:00 1
2 2016-01-01 05:32:00 1
3 2016-01-01 05:38:00 1
4 2016-01-01 05:46:00 1
5 2016-01-01 05:47:00 1
6 2016-01-01 06:07:00 1
7 2016-01-01 06:13:00 2
8 2016-01-01 06:21:00 1
9 2016-01-01 06:22:00 1
10 2016-01-01 06:25:00 1
Ich möchte wissen, wie man die Anzahl der verkauften Tickets innerhalb eines bestimmten Zeitrahmens für alle Tickets berechnet. Zum Beispiel möchte ich die Anzahl der verkauften Tickets bis zu 15 Minuten nach allen Tickets berechnen. In diesem Fall hätte die erste Zeile drei Tickets, die zweite Zeile vier Tickets usw.
Idealerweise suche ich nach einer dplyr-Lösung, da ich dies für mehrere Geschäfte mit einer group_by()
-Funktion tun möchte . Allerdings habe ich ein wenig Mühe herauszufinden, wie man jeden Timestamp für eine bestimmte Zeile festhält und gleichzeitig alle Timestamps über die dplyr-Syntax durchsucht.
Nicht ganz. Dies wäre die richtige Antwort nur für die zweite Reihe. Das Fenster, das jede Zeile benötigt, ist unterschiedlich. Also für die erste Reihe möchte ich die Anzahl der Tickets zwischen 5:30 und 5:45 Uhr wissen, die zweite Reihe wäre die Anzahl der Tickets zwischen 5:32 und 5:47, die dritte Reihe zwischen 5:38 und 5 : 53 usw. Macht das Sinn? – dmartin