Ich plane sklearn.decomposition.TruncatedSVD
verwenden LSA für einen Wettbewerb Kaggle auszuführen, ich kenne die Mathematik hinter SVD und LSA, aber ich bin von Scikit-Learn in der Bedienungsanleitung zu verwechseln, also bin ich nicht sicher, wie tatsächlich anwenden TruncatedSVD
.Scikit-Learn TruncatedSVD Dokumentation
In the doc, es heißt:
Nach dieser Operation
U_k * transpose(S_k)
das transformierte Training mitk
Merkmalen (genanntn_components
in der API) gesetzt ist
Warum ist das? Ich dachte nach SVD, X
, um diese Zeit X_k
sollte U_k * S_k * transpose(V_k)
sein?
Und dann heißt es,
Um auch ein Test Transformationssatz
X
multiplizieren wir es mitV_k
:X' = X * V_k
Was bedeutet das?