Bei einer Abfrage habe ich einen Cosinus-Score für ein Dokument. Ich habe auch die Dokumente pagerank. Gibt es eine gute Standardmethode, die beiden zu kombinieren?Kombinieren von TF-IDF (Kosinusähnlichkeit) mit PageRank?
ich multiplizieren dachte sie
Total_Score = cosine-score * pagerank
Denn wenn Sie zu niedrig auf beiden Pagerank oder Kosinus-Score zu erhalten, das Dokument nicht interessant ist.
Oder ist es vorzuziehen, eine gewichtete Summe zu haben?
Total_Score = weight1 * cosine-score + weight2 * pagerank
Ist das besser? Dann haben Sie möglicherweise eine Null-Kosinus-Punktzahl, aber einen hohen Seitenrang, und die Seite wird unter den Ergebnissen angezeigt.
Die gewichtete Summe ist auf der richtigen Spur, aber möchten Sie einen w * log (PageRank) machen? oder w * log (1 + PageRank)? All dies wäre eine lineare Kombination, möchten Sie nicht eine nichtlineare Kombination betrachten, die eine sigmoide Signatur hat? – sAguinaga