Ich bin noch relativ neu zu R, also Entschuldigung im Voraus, wenn meine Frage zu einfach scheint.Wie finde ich die häufigsten Werte über mehrere Spalten mit Faktoren
Mein Problem ist wie folgt:
ich einen Datensatz mit mehreren Faktorvariablen haben, die die gleichen Kategorien haben. Ich muss die Kategorie finden, die am häufigsten für jede Beobachtung über die Faktorvariablen auftritt. Im Falle von Bindungen kann ein beliebiger Wert gewählt werden, obwohl es großartig wäre, wenn ich mehr Kontrolle darüber hätte.
Mein Datensatz enthält über hundert Faktoren. Jedoch ist die Struktur so ähnlich:
id <- 1:3
var1 <- c("red","yellow","green")
var2 <- c("red","yellow","green")
var3 <- c("yellow","orange","green")
var4 <- c("orange","green","yellow")
df <- data.frame(cbind(id, var1, var2, var3, var4))
> df
id var1 var2 var3 var4
1 1 red red yellow orange
2 2 yellow yellow orange green
3 3 green green green yellow
die Lösung eine Variable innerhalb des Datenrahmens sein sollte, zum Beispiel var5, die die häufigste Kategorie für jede Zeile enthält. Es kann ein Faktor oder ein numerischer Vektor sein (falls die Daten müssen zuerst in numerische Vektoren umgewandelt werden) In diesem Fall
, möchte ich an dieser Lösung haben:
> df$var5
[1] "red" "yellow" "green"
Jede Beratung wird sehr geschätzt! Danke im Voraus!
netter Job, sauberer als meins. Hatte nicht realisiert, dass ich alle Conversions, Unlisting usw. überspringen konnte. –
Vielen Dank für diese Lösung. Ich habe es gerade auf meinen eigenen Daten versucht und es funktioniert perfekt! Können Sie, bitte, nur für mich klären, wie löst diese Methode die Bindungen? Vielen Dank! – ZMacarozzi
Ich redigierte meine Antwort, um Fall mit einer Bindung zu veranschaulichen. Es ist eine gute Angewohnheit zu lernen, wie man die Hilfeseiten benutzt. Ich bin froh, dass meine Lösung für Sie funktioniert hat. – Chargaff