2016-05-12 9 views

Antwort

14

Jedes Wort im Vokabular hat ein zugeordnetes Vokabularobjekt, das einen Index und eine Zählung enthält.

vocab_obj = w2v.vocab["word"] 
vocab_obj.count 

Ausgang für Google News W2V Modell: 2998437

Also für jedes Wort die Zählung zu erhalten, würden Sie alle Wörter und vocab Objekte im Vokabular iterieren.

for word, vocab_obj in w2v.vocab.items(): 
    #Do something with vocab_obj.count 
+5

Ab [ 'gensim' 1.0.0] (https://github.com/RaRe-Technologies/gensim/releases/tag/1.0.0), müssen Sie' w2v.wv.vocab tun ["Wort"]. Zähle statt "w2v.vocab [" Wort "]. Zähle". –