Ich versuche, das Word2vec-Modell in der Bibliothek Gensim in Python implementiert anzuwenden. Ich habe eine Liste von Sätzen (jeder Satz ist eine Liste von Wörtern).Verschiedene Modelle mit Gensim Word2Vec auf Python
Zum Beispiel lassen Sie uns:
sentences=[['first','second','third','fourth']]*n
und ich zwei identische Modelle implementieren:
model = gensim.models.Word2Vec(sententes, min_count=1,size=2)
model2=gensim.models.Word2Vec(sentences, min_count=1,size=2)
Ich stelle fest, dass die Modelle manchmal die gleichen sind, und manchmal unterschiedlich sind, je nach dem Wert von n.
Zum Beispiel, wenn n = 100 I erhalten
print(model['first']==model2['first'])
True
während für n = 1000:
print(model['first']==model2['first'])
False
Wie es möglich ist?
Vielen Dank!
Eigentlich der zweite Fall, wenn das Ergebnis des Textes True ist, ist mit n = 5000 – Valentina
In Der Code, den Sie eingefügt haben, 'Modell' trainiert auf' sententes' und Modell2 trainiert auf 'sätzen'. Ist das ein Kopierfehler oder ist das Ihr tatsächlicher Code? –
Leider ist es nur ein Kopierfehler. – Valentina