Ich berechnete tf/idf Werte von zwei Dokumenten. Im Folgenden sind die tf/idf Werte:Cosine Ähnlichkeit
1.txt
0.0
0.5
2.txt
0.0
0.5
Die Dokumente sind wie:
1.txt = > dog cat
2.txt = > cat elephant
Wie kann ich diese Werte verwenden Kosinusähnlichkeit zu berechnen?
Ich weiß, dass ich das Skalarprodukt berechnen sollte, dann finden Sie die Entfernung und dividieren Sie Punktprodukt damit. Wie kann ich dies mit meinen Werten berechnen?
Noch eine Frage: Ist es wichtig, dass beide Dokumente die gleiche Anzahl von Wörtern haben?
Ist das nicht mehr angemessen zu berechnen /? –
Es ist eine Information Retrieval-Aufgabe, nicht etwas, was eine reine Mathematik Person interessieren würde –
Bitte hören Sie auf zu empfehlen mathoverflow.net - es ist für ernsthafte mathematische Fragen. –