ich folgende Fehlermeldung auf den Anruf erhalten cosine_similarityscikit Typ Fehler lernen nur Integer-Arrays mit einem Element kann auf einen Index umgewandelt werden
numerator = sum(a*b for a,b in zip(x,y))
TypeError: only integer arrays with one element can be converted to an index
Ich versuche, ein Stichwort-Schlüsselwort Kookkurrenzmatrix von zu erhalten die von CountVectorizer zurückgegebene Dokument-Schlüsselwort-Matrix.
Ich glaube, es gibt etwas, das mag nicht über den Datentyp, den ich es überlasse, aber ich bin mir nicht sicher, was genau das Problem ist. Hier ist n
vom Typ scipy.sparse.csc.csc_matrix
und y
ist vom Typ scipy.sparse.csr.csr_matrix
documents = (
"The sky is blue",
"The sun is bright",
"The sun in the sky is bright",
"We can see the shining sun, the bright sun"
)
countvectorizer = CountVectorizer()
y = countvectorizer.fit_transform(documents)
n = y.T.dot(y)
x = n.tocsr()
x = x.toarray()
numpy.fill_diagonal(x, 0)
result = cosine_similarity(x, "None")
Erste Schätzung wäre die spärliche Darstellung, die Probleme verursacht, haben Sie versucht, die Matrizen in die nicht-spärliche Darstellung zu konvertieren? – ncfirth
@ncfirth Mit nicht-sparse meinen Sie zu numpy Array? – newdev14
Yeah [weitere Charaktere] – ncfirth