Ein data.table
Paket kann ein sehr bequemes Werkzeug sein, um mit Datensätzen zu arbeiten. Vor allem, wenn die Daten, die Sie bearbeiten, groß sind.
Angenommen, Sie mit zwei Variablen und einer von ihnen eine Datentabelle NA
Werte
> DT = data.table(var1=c(1,NA,3,NA), var2=c(5,6,7,8))
> DT
var1 var2
1: 1 5
2: NA 6
3: 3 7
4: NA 8
Dann können Sie einfach which()
Befehl haben haben die Teilmenge von NAs
oder anwenden ‚nicht‘ Operator vor finden !which()
zu Subset diejenigen Zeilen, die NAs
in var1 nicht haben.
> DT[which(is.na(var1))]
var1 var2
1: NA 6
2: NA 8
Weisen Sie darauf hin, dass die Aussage oben wird nur das Ergebnis drucken und werden keine Änderungen an der ursprünglichen Datentabelle machen.
Here können Sie eine große FAQ auf data.table
finden.
Versuchen Sie 'is.na (data $ x)' stattdessen. – Gopala
müssen Sie nicht auf 'data' in' subset' verweisen so 'subset (data, x == NA)'. Außerdem ist "NA" nicht vergleichbar, Sie benötigen also eine spezielle Funktion "Teilmenge (Daten, is.na (x))", aber dies gibt Ihnen einen Datenrahmen. Ich bin mir nicht sicher, ob Sie das wollen oder ein Vektor – rawr