Für eine einfache Auswertung auf meinem Doc2Vec Trainingsmodell, muss ich 400-dimensionale Vektoren in 2-dimensionale transformieren und visualisieren die Dokumente als eine Menge von Knoten, wo der Abstand zwischen zwei beliebigen Knoten ist umgekehrt proportional zu ihrer Ähnlichkeit (Knoten, die sehr ähnlich sind, liegen nahe beieinander).Python - Doc2Vec mehrdimensionale Vektoren in 2D mit Sklearn MDS Klasse
Nach einigem Suchen habe ich MDS (multidimensional scaling) und sklearn MDS Bibliothek dafür gefunden.
Jetzt habe ich 2,2M Vektoren, die jeder von ihnen 400 Dimensionen hat und ich weiß nicht, wie sie an MSN-Funktion in der richtigen Syntax mit den niedrigsten Kosten sklearn übergeben können. Ich weiß, erstellen Ähnlichkeitsmatrix zwischen 2.2M Vektoren ist unmöglich.