2016-05-19 24 views
1

Ich trainierte gensim.models.doc2vec.Doc2Vec Modell
d2v_model = Doc2Vec (Sätze, size = 100, Fenster = 8, min_count = 5, Arbeiter = 4) und ich kann Dokumentenvektoren von docvec = d2v_model bekommen. docvecs [0]Wie man Wortvektoren von einem Gensim Doc2Vec erhält?

Wie kann ich Wortvektoren vom trainierten Modell erhalten?

Antwort

2

Doc2Vec erbt von Word2Vec, und daher kann man Wort zugreifen Vektoren die gleichen wie in Word2Vec, direkt durch Indizieren des Modells:

wv = d2v_model['apple'] 

Beachten Sie jedoch, dass ein Doc2Vec Trainingsmodus wie reiner DBOW (dm=0) benötigt oder erstellt keine Wortvektoren. (Pure DBOW funktioniert immer noch ziemlich gut und schnell für viele Zwecke!) Wenn Sie von einem solchen Modell auf Wortvektoren zugreifen, werden sie nur die automatisch zufällig initialisierten Vektoren sein, ohne Bedeutung.

Erst wenn der Doc2Vec Modus selbst Co-Züge Wort-Vektoren, wie in dem DM-Modus (Standard dm=1) oder wenn die optionale Wort-Ausbildung DBOW (dm=0, dbow_words=1) geben, Wort-Vektoren und doc-Vektoren beide gelernt gleichzeitig .