Ich möchte na.omit (Daten) für das folgende Beispiel-Dataset verwenden, aber unter einer Bedingung, um Zeilen mit NAs nur zu entfernen, wenn sie vorhanden sind, sagen wir "mehr als 30%" der Spalten.Wie können Zeilen mit NAs nur entfernt werden, wenn sie in mehr als einem bestimmten Prozentsatz von Spalten vorhanden sind?
Daten:
C1 C2 C3 C4 C5
Gene1 0.07 NA 0.05 0.07 0.07
Gene2 0.2 0.18 0.16 0.15 0.15
Gene3 NA 0.93 0.9 NA 0.92
Gene4 0.32 0.05 0.12 0.13 0.05
Gene5 0.44 0.53 0.46 0.03 0.47
Gene6 NA 0.34 NA 0.8 NA
Gene7 0.49 0.55 0.67 0.49 0.89
Gene8 0.25 NA 0.49 NA NA
Gene9 0.1 0.1 0.05 NA 0.09
die resultierende Datei sollte also wie folgt aussehen:
C1 C2 C3 C4 C5
Gene1 0.07 NA 0.05 0.07 0.07
Gene2 0.2 0.18 0.16 0.15 0.15
Gene4 0.32 0.05 0.12 0.13 0.05
Gene5 0.44 0.53 0.46 0.03 0.47
Gene7 0.49 0.55 0.67 0.49 0.89
Gene9 0.1 0.1 0.05 NA 0.09
Danke für die Hilfe!
Wie sind Sie entscheiden, welche NA-Werte zu entfernen? –
Hallo Tim, es kommt nicht darauf an, welche NAs. Nur wenn mehr als 30% NA für eine bestimmte Zeile vorhanden sind, wird die Zeile vollständig entfernt. – Letin
Was haben Sie versucht? Zeigen Sie etwas Code. –