*** Um diese Frage zu stellen, habe ich in meinem Beispiel eine Zeitspalte entfernt, die in meinen tatsächlichen Daten vorhanden ist, die die tatsächliche Zeit enthält (mit verschiedenen Sekunden trotz gleicher nominaler Zeit)), was dazu führte, dass meine Daten eine Punktzahl pro Zeile aufwiesen. Wenn ich diese Zeiten rundete, löste ich mein Problem mit dcast :)R data.table cleaning - Zeilen nach mehrfachen Kriterien zusammenfassen
Ich versuche gerade, meine Daten aufzuräumen und ich laufe in einige Roadblocks (ich bin ein Anfänger zu R und mache die meisten meiner Erkenntnisse daraus Seite? ˅). Ich möchte meine Daten so transformieren, dass die Symptome in Spalten angezeigt werden, die sowohl auf der Übereinstimmung der Person als auch auf der Nominalzeit des Symptoms basieren. Durch diese Datenbereinigung werde ich meinen Datensatz von 64.000 Beobachtungen auf etwa 8.000 reduzieren. Meine Daten sieht derzeit wie folgt aus:
library(reshape2)
WideSymptomData <- dcast(SymptomData,Person+Nominal.Time~Symptom.Name, value.var="Symptom.Score")
Person Nominal.Time A B C
1 +30 6
1 +30 9
1 +30 3
2 +90 1
2 +90 5
2 +90 2
Aber leider bin ich an diesem Punkt ratlos:
Person Nominal.Time Name Score
1 +30 A 6
1 +30 B 9
1 +30 C 3
2 +90 A 1
2 +90 B 5
2 +90 C 2
ich meine Daten in das folgende war in der Lage zu machen. Ich habe recherchiert und kann nicht scheinen, um herauszufinden, wie der nächste Schritt, dies zu tun, um schließlich zu erreichen:
Person Nominal.Time A B C
1 +30 6 9 3
2 +90 1 5 2
Ich denke, das question könnte ähnlich wie ich, obwohl ich nicht in der Lage war, um erfolgreich die Anwendung Antworten dafür. Jede Anleitung wird sehr geschätzt, danke!
'reshape (Daten, dir = 'breit', idvar = c ('Person', 'Nominal.Time'), timevar = 'Symptom.Name') ' – rawr