Ich möchte meinen Datenrahmen unterteilen, um nur Gruppen zu behalten, die 3 oder mehr Beobachtungen an VERSCHIEDENEN Tagen haben. Ich möchte Gruppen loswerden, die weniger als 3 Beobachtungen haben, oder die Beobachtungen, die sie haben, sind nicht von 3 verschiedenen Tagen.Entfernen von Gruppen mit weniger als drei eindeutigen Beobachtungen
Hier ist ein Beispieldatensatz:
Group Day
1 1
1 3
1 5
1 5
2 2
2 2
2 4
2 4
3 1
3 2
3 3
4 1
4 5
So für das obige Beispiel, Gruppe 1 und Gruppe 3 gehalten werden, und die Gruppe 2 und 4 werden aus dem Datenrahmen entfernt werden.
Ich hoffe, dass dies sinnvoll ist, ich stelle mir vor, die Lösung wird ganz einfach sein, aber ich kann es nicht erarbeiten (ich bin ziemlich neu in R und nicht sehr schnell bei Lösungen zu solchen Dingen). Ich dachte, dass die Diff-Funktion vielleicht nützlich sein könnte, aber nicht viel weiter ging, und ich hatte kein Glück, bestehende Fragen auf SO und anderen Websites nach einer Antwort zu durchsuchen.
Vielen Dank im Voraus!
Versuchen 'df [df $ Group% in% betragen würde as.numeric (Namen (die (tapply (df $ Tag, df $ Gruppe, Funktion (x) Länge (eindeutig (x))> = 3)))),] ' – nicola