Antwort

3

Kollaborative Filterung mit einer Pearson-Korrelation leidet unter einigen Problemen. Ich werde ein paar der Großen Liste:

  • Skalierbarkeit
    Wenn Ihre Datenbank wächst, ist es immer länger dauert, eine pearson Korrelation zwischen den Nutzern zu berechnen. Da Sie eine Korrelation zwischen jedem Benutzer berechnen müssen, wird dies exponentiell wachsen.

  • Daten sparsity
    Dies ist ein großes Problem für die meisten Empfehlungs-Engines. Wenn Sie viele Benutzer und viele Elemente mit ein paar Überprüfungen haben, wird es schwierig, Empfehlungen zu generieren, da Sie zu wenig Daten haben, um eine Korrelation zwischen Benutzern zu berechnen.

  • Kaltstartproblem
    Technisch leidet jede Methode an diesem Problem, aber die Matrixfaktorisierung bewältigt dies besser als ein kollaborativer Filter. Ein Kaltstartproblem bedeutet im Grunde, dass Sie keine oder kaum Daten über einen Benutzer haben. Sie können dies nicht lösen, wenn Sie einen kollaborativen Filter verwenden. Zeitraum.
    Sie können alternative Techniken verwenden, um dieses Problem zu umgehen, d. H. Inhaltsbasierte Filterung.

Bestimmung, welche Methode Sie schwierig sein können sollte. Die Matrix-Faktorisierung übertrifft herkömmliche benutzerbasierte und auf Elementen basierende kollaborative Filterung, aber Sie müssen entscheiden, ob sie am besten zu Ihrem Modell passt.
Wenn Sie keine sparse Datenbank haben, würde ein kollaborativer Filter gut funktionieren, aber auch eine Matrix-Faktorisierungsmethode.

Hier sind einige interessante Websites, die Daten zu diesen Methoden enthalten. Am Ende entscheiden Sie oder Ihr Team, welche Methode am besten funktioniert.

Fühlen Sie sich frei, mehr zu fragen, ob dies nicht klar genug war!

+0

Matrixfaktorisierung ist auch eine Art von kollaborativen Filter. – crackjack