Ich bin sicher, dass dies eine sehr grundlegende Frage ist:In R, wie Kategorien zu reduzieren oder Variablen neu zu kategorisieren?
In RI hat 600.000 kategorische Variablen - die jeweils als „0“ eingestuft ist, „1“ oder „2“
Was ich möchte do ist kollabieren "1" und "2" und lassen Sie "0" von selbst, so dass nach der Neukategorisierung "0" = "0"; "1" = "1" und "2" = "1" --- am Ende möchte ich nur "0" und "1" als Kategorien für jede der Variablen.
Wenn es mir möglich wäre, würde ich lieber nicht 600.000 neue Variablen erstellen, wenn ich die vorhandenen Variablen durch die neuen Werte ersetzen könnte, die toll wären!
Was wäre der beste Weg, dies zu tun?
Vielen Dank!
Vielen Dank für die Antwort! Dies ist, wie ich es speziell auf meine Daten anwende. Meine Daten liegen in Form eines data.frames vor, den ich gerne pflegen würde: data <- read.table ("k.csv", header = TRUE, sep = ",") dta <- daten [ , 1: 30] col = dim (dta) [2] für (y in 1: col) { py <- Faktor (pmin (as.data.frame (dta [, y]), 2) , Etiketten = c ("0", "1")) py } Natürlich führt das zu einem Fehler - ich bin mir sicher, dass ich es nicht richtig anwende – CCA