2009-10-23 3 views

Antwort

8

Microsoft hat in der Vergangenheit eine Neural Network Ranking Function als Ranking-Funktion verwendet. Das neuronale Netzwerk kombiniert die Hunderte von Variablen, die eine Url damit verknüpft hat, bezogen auf das Ranking. Paper Sie würden in der Regel mehr als 100 Dokumente mit einem detaillierten Ranker erzielen. Jeder Abfrageknoten muss seine Top-Dokumente isolieren und an den Aggregator zurückgeben. Ranking ist in der Tat sehr komplex und Scoring-Algorithmen sind in der Regel mehrstufig.

Für Rechenjobs, Faktorgenerierung usw. Die Microsoft-Suche verwendet SCOPE, von denen ich glaube, dass sie auf Dryad basiert, verwendet aber DryadLINQ nicht. SCOPE ist im Grunde eine SQL-Sprache auf einem Cluster.

Tatsächlich ist Microsoft bei der Suche weit offener als Google. Microsoft Research Asia und Microsoft Research Silicon Valley

0

Die Informationen aus zweiter Hand, aber ich verstehe, dass sie invertierte Indizes (Indizes?) Verwenden, um die Top 100 oder so Ergebnisse zu finden, und dann verwenden sie eine Reihe von neuronalen Netzen, um es mehrmals zu den Top 10 einzugrenzen , Top 3, und dann den ersten zu finden.

Sie tun dies, weil sie den ersten Treffer begründen, was eine Benutzer Sache die Suchmaschine funktioniert oder nicht macht. Wenn Sie nach CNN suchen und CNN.com nicht als erster Treffer erhalten, denken die Benutzer, dass die Engine nicht funktioniert.

Auch dies ist Wissen aus zweiter Hand. Ich habe das von einem Freund gehört, der eine Weile bei MS in ihrem Suchteam gearbeitet hat.

+0

und Karte reduzieren ist nicht wirklich Teil des Suchalgorithmus. es ist nur eine Möglichkeit, ein Problem in parallele Teile zu zerlegen. das sagend, benutzen sie wahrscheinlich etwas ähnliches. –

+0

stimmte zu, dass es nicht der Algorithmus ist, der die Suche durchführt, sondern die Dokumente von Google liest, der Seitenrang (das Rückgrat der Google-Qualität der Ergebnisse) verwendet diesen Algorithmus, daher ist er suchbezogen. –