Nach dem Training eines Word2vec-Modells mit Python gensim, wie finden Sie die Anzahl der Wörter im Vokabular des Modells?gensim word2vec: Finden Sie die Anzahl der Wörter im Vokabular
9
A
Antwort
25
Das Vokabular befindet sich im Feld vocab
der wv
-Eigenschaft des Word2Vec-Modells als Wörterbuch, wobei die Schlüssel jedes Token (Wort) sind. So ist es nur die üblichen Python für die Länge eines Wörterbuch bekommen: (. Bei älteren GENSIM Versionen vor 0.13, vocab
erschien direkt auf dem Modell So Sie w2v_model.vocab
statt w2v_model.wv.vocab
verwenden würde.)
len(w2v_model.wv.vocab)