Ich bin über viele ähnliche Fragen im Internet gestolpert, konnte aber keine finden, die mein Problem löst, das ich verstehen kann. Ich würde mich über einige Erklärungen hier freuen, um mein Verständnis zu unterstützen. Danke im Voraus!Wie ermittelt man die Bedeutung von Variablen in PCA mit Matlab?
So
[COEFF,SCORE,latent,tsquare] = princomp(X)
Ich verstehe, für coeff
, dass die Spalten in der Reihenfolge abnehmender Komponentenvarianz sind. Aber weiß ich die Bedeutung meiner Variablen (Original-Dataset), nicht die Bedeutung der Hauptkomponente (PC), wie die Antwort von coeff
könnte. Gibt es eine Möglichkeit, die Bedeutung der Variablen, die ich habe, zu bewerten?
Ich habe gesehen, dass viele Statistik-Software in der Lage ist, dies zu tun, zeigt, welche ursprünglichen Variablen am meisten zum Plot beitragen, und welche diejenigen sind, die entfernt werden können, um übermäßige Probleme zu vermeiden. Gibt es eine Möglichkeit, dies mit MatLab zu tun?
Mein Ziel ist es, die Daten in einem 2D-Diagramm zu plotten, was bedeutet, dass ich PC1 und PC2 verwenden werde, die die signifikanteste Komponentenvarianz enthalten. Woher weiß ich also, welche Variablen beibehalten werden sollten und welche verworfen werden sollten?
Kann mir das jemand erklären? Vielen Dank!
Aber wie für den zweiten Teil erwähnten Sie den maximalen absoluten Wert in den ersten beiden Spalten von COEFF. Aber woher weißt du, aus welchen Variablen diese Werte stammen? Stehen sie in der gleichen Reihenfolge wie ich sie definiere? Weil ich weiß, dass die Spalten in COEFF in der Reihenfolge abnehmender Komponentenvarianz neu angeordnet werden, aber ich bin mir nicht sicher über die Zeilen. Willst du damit sagen, dass die Zeilen nicht neu geordnet sind und in der Reihenfolge meiner Eingaben gehalten werden? – maureen
Ja, ich habe ein Problem mit dem zweiten Teil. Sorry hatte einige Probleme mit dem Beitrag früher .... – maureen
@maureen Kennen Sie lineare Umsetzungen mit Matrizen? – Shai