2016-07-19 9 views
0

Meine Eingabedatei ist mit einer Proben-ID als Zeilenname organisiert und jede Spalte stellt eine bestimmte operative taxonomische Einheit dar, wobei die Daten eine Zahl für die absolute Häufigkeit dieser OTU sind. Ich habe die CSV-Datei mit binären Dummy-Variablen eingerichtet, um die Stichprobe als eine von drei Stellen (L1, L2, L3) und eine von sechs beschreibenden Kategorien (D1, D2, D3, D4, D5, D6) anzugeben. Jedes Sample hat eine 1 für eine der drei L-Kategorien und eine der 6 D-Kategorien und Nullen für die anderen 7 Kategorien, zu denen sie nicht gehören. Die Dummy-Variablen befinden sich in den ersten 9 Spalten der Datentabelle. Als ich die CCA mit dieser Formel laufen:Warum fehlen mir 2 Vektoren der Umweltvariablen aus dem CCA-Plot in R (veganes Paket)?

L6DummyVariables.cca <- cca(L6DummyVariables[ ,10:100] ~ L1+L2+L3+D1+D2+ D3+D4+D5+D6, 
          data=L6DummyVariables) 

und plotten es, gibt es keine Vektorpfeile für L3 und D6. Muss ich etwas in meiner Formel ändern? Mir wurde von jemandem gesagt, dass sie abwesend sind, weil die anderen Vektoren in Bezug zu dem fehlenden stehen, aber das scheint für mich keinen Sinn zu ergeben. Die anderen Tutorials, die ich angeschaut habe, scheinen alle Variablen zu zeigen. Meine Ordinationserfahrung ist sehr begrenzt, also entschuldige ich mich, wenn ich etwas Grundlegendes verpasse. Vielen Dank!

+0

Wenn Sie "L" und "D" als Faktoren und keine Dummy-Variablen in Ihrem Datenrahmen codiert hätten, hätte "cca" das Richtige getan & Behandlungskontraste für Sie erstellt und genügend Informationen aufgezeichnet, um das zu ermöglichen Variablen, die in der Handlung korrekt dargestellt werden. Sie sollten kategorische Vars nicht als Pfeile hier darstellen; Wie würdest du den Pfeil deuten? Als zunehmende Neigung, eine bestimmte Gruppe zu sein? Nun, das würde nicht gelten, weil es keine solche Maßnahme in der Analyse gibt. Kategorische Variablen wie diese sollten als Zentroide dargestellt werden, und ** vegan ** würde das für Sie tun ... –

+0

@Gavin Sie sollten in Erwägung ziehen, eine Antwort zu posten. Dein Kommentar ist besser als meine Antwort. –

Antwort

0

L1-, L2- und L3-Vektoren sind mit dem (Intercept) -Begriff kollinear, sodass einer von ihnen, L3 in diesem Fall, fallen gelassen wird. Gleiches gilt für eine Ihrer deskriptiven Variablen. Es klingt so, als ob deine Regressions- oder lineare Algebra-Erfahrung hier kausale "Begrenzung" ist, anstatt "Ordinations-Unerfahrenheit". Wir können die "anderen" nicht zitierten Tutorials nicht kommentieren. Ein Hinweis zur Terminologie: "Umgebungsvariablen" ist ein Begriff, der zur Beschreibung von Variablen auf Systemebene verwendet wird, die die Aktionen von R und zugehörigen Paketen bestimmen. Wenn Sie diese Phrase mit R-Programmierern verwenden, führt dies wahrscheinlich zu Verwirrung, wenn Sie sich auf Ihre Kovariaten beziehen.

Es ist auch wahrscheinlich, dass Sie Mühe verschwenden, Dummy-Variablen zu erstellen. R-Faktoren sind in der Lage, eine eindeutige Gruppenmitgliedschaft zu codieren, und R-Regressionsfunktionen erzeugen automatisch die "Dummies" zum Zeitpunkt der Modellmatrix-Konstruktion.