Ich lerne gerade R von Grund auf neu und versuche die Anzahl der NA's in einer gegebenen Tabelle zu zählen, aggregiert mit der ID der Datei, aus der sie stammt. Ich möchte dann diese Information in einem neuen Datenrahmen ausgeben, der nur die ID und die Summe der darin enthaltenen NA-Zeilen zeigt. Ich habe mir einige ähnliche Fragen angeschaut, aber alle scheinen mit sehr kurzen Datensätzen zu arbeiten, während meine vergleichsweise lang ist (10k + Zeilen), so dass ich nicht jede einzelne Zeile zusammenfassen kann.NA-Werte nach ID zählen?
Idealfall, wenn ich mit einer Datentabelle namens „Data“ mit insgesamt vier Spalten und einer Spalte mit dem Namen „ID“ beginnen, würde Ich mag einen Datenrahmen zur Ausgabe, die einfach ist:
[ID] [NA_Count]
1 500
2 352
3 100
Vielen Dank im Voraus ...
Versuchen Sie 'Bibliothek (dplyr); Bibliothek (tidyr); sammeln (Daten, Var, Val, -ID)%>% group_by (ID)%>% zusammenfassen (CountNA = Summe (is.na (Val))) ' – akrun
Willst du in einem anständigen lesen? Anzahl der Dateien und zählen Sie dann die Gesamtzahl der fehlenden Werte aus jeder Datei? Wenn ja, wie sind die Dateien strukturiert? Gibt es mehrere Variablen pro Datei? – lmo
Bitte werfen Sie einen Blick auf den folgenden Link, um ein minimales reproduzierbares Beispiel zusammenzustellen. [minimales Beispiel] (http://stackoverflow.com/help/mcve). – lmo