Lange Zeit lurker, zum ersten Mal Poster.Fehler in UseMethod ("select_")
Ich bin in einem einführenden R-Kurs und ich versuche, Histogramme und Zusammenfassungen für das Alter der Diagnose mit Diabetes "diabage2" und ihr Insulin verwenden "Insulin" (Ja/Nein/NA) zu erstellen. Der Datensatz ist brfss2013.
Mein erster Versuch wurde brfss2013 %>% group_by(insulin = "Yes") %>% summarise(MEAN = mean(brfss2013$diabage2, na.rm = TRUE), n = n())
insulin MEAN n
<chr> <dbl> <int>
1 Yes 51.48694 491775
Welche sieht gut aus, es sei denn ich weiß, dass MEAN und n für die Probe berichtet bedeuten und n, nicht der ausgewählte Teil der Probe (Ich habe dieses Problem hatte in einem anderen Teil meines Projekts - nicht sicher, warum es nicht funktioniert. Ich kann überprüfen, dass die Antwort falsch ist.)
Wenn ich versuchte, subset() zu verwenden und nur für Daten auszuwählen, die meine Bedingungen erfüllten, also könnte ich leicht zusammenfassen es und machen Histogramme (dh eine Gruppe von Daten, bei denen Insulin = ja und eins für Insulin = nein)
Diese sahen gleich aus, obwohl sie keine der gleichen Beobachtungen enthalten sollten, da sie sich gegenseitig ausschließen.
Als ich versuchte, wählen Sie() zu verwenden, um das Set zu trimmen ich von 330 Variablen zu drei verwenden, ich ein anderes Problem gestoßen:
InsulinData <- select(brfss2013$insulin, brfss2013$diabage, brfss2013$sex, brfss2013$X_state)
gab mir den Fehler
Error in UseMethod("select_") :
no applicable method for 'select_' applied to an object of class "factor"
Was ich nicht weiß, was ich machen soll.
Ich habe das Gefühl, dass ich etwas sehr grundlegendes vermisse, aber mein Mangel an Erfahrung bedeutet, dass ich nicht die Grundlagen habe, um viele Lösungen für die Probleme anderer Leute zu verstehen, und der Kurs hat bisher mehr statistische Theorie als abgedeckt die tatsächlichen Details des Umgangs mit R. Ich würde wirklich jede Anleitung schätzen, die ich bekommen könnte.
'brfss2013' kommt nicht mit dem dplyr-Paket, also möchten Sie dies vielleicht expliziter reproduzierbar machen. Normalerweise würde man den Code schreiben, der das Dataset wie 'library (whatever)' ergreift oder lädt. – Frank
Ich sehe hier ein paar Fehler, wie "Insulin =" Ja "" statt "=="; bezieht sich auf Spalten mit '$' innerhalb einer dplyr-Kette; Verwenden von "Teilmenge", wenn das dplyr-Idiom "Filter" (oder ein ähnliches Wort) ist.Ich würde empfehlen, einfach das R-Intro-Dokument von oben zu durchsuchen und einige Beispiele durchzugehen: https://cran.r-project.org/doc/manuals/r-release/R-intro.html – Frank