2011-01-17 11 views
1

gelten folgende Voraussetzungen:Wie kann man das Benutzerverhalten mit grundlegenden Statistiken vorhersagen?

Kategorie "Electronics" enthält Produkt "Bluerays" unter anderen Produkten.

Was sind einige grundlegende Statistiken, die ich implementieren kann, um mehr "Bluerays" zu empfehlen, wenn der Benutzer unter Elektronik durchsucht? Im Moment habe ich nur einen lahmen "Bluerays wurden 3 von 5 mal in der Kategorie Elektronik für diesen Benutzer gekauft", so die Wahrscheinlichkeit ist 60% - empfehlen mehr Bluerays.

BEARBEITEN: Was passiert, wenn ich aus der Perspektive eines Verkäufers komme, wo ich das Eingabefeld automatisch füllen möchte? Beispiel: Wenn der Verkäufer Bluerays in der Regel verkauft, möchte ich das Feld "Bedingung" beim nächsten Verkauf unter "Elektronik" automatisch ausfüllen, um die Benutzererfahrung zu verbessern.

Antwort

4

Dies ist ein ziemlich tiefes Thema. Ich würde anfangen, einige Suchen für kollaborative objektbasierte Filterung oder kollaborative benutzerbasierte Filterung durchzuführen.

Dies sind einige gute Bücher über das Thema:

Collective Intelligence Programmierung http://my.safaribooksonline.com/book/web-development/9780596529321

Collective Intelligence In Aktion http://my.safaribooksonline.com/book/programming/java/9781933988313

+0

'Programmierung Collective Intelligence' ist das Buch, das Sie suchen. In der Tat gibt es ein ganzes Kapitel basierend auf Produktempfehlungen. Das Buch ist sehr leicht zu lesen, sogar für Leute, die sich nie mit maschinellem Lernen beschäftigt haben. –

1

Vielleicht ähnliche Benutzer beinhalten. Zum Beispiel kaufen 75% der Nutzer, die Blu-ray-Geräte kaufen, auch DVD-Racks. Wenn also jemand einen Blueray kauft, schlagen Sie ihm die Idee eines DVD-Racks vor.

+0

Interessante Idee. Benutzer-zu-Benutzer-Korrelation. Vielen Dank – huisjames

2

Ihre Frage betrifft Empfehlungssysteme. Sie sind daran interessiert, Ähnlichkeiten zu finden, die Ihnen helfen können, gute Empfehlungen zu geben. Diese Ähnlichkeiten können auf verschiedene Arten gemessen werden. Am gebräuchlichsten ist es, das Verhalten der Leute, die in Ihrer Site gekauft haben, in der Vergangenheit zu betrachten und Ähnlichkeiten zwischen ihnen zu suchen. Dies kann unter Verwendung einer einfachen Korrelation zwischen den Vektoren der Produkte erfolgen. Wenn Sie auch Daten über die Personen (Alter, Geschlecht) haben, die normalerweise auf Ihrer Website kaufen, können Sie diese Art von Informationen verwenden, um Ihr Empfehlungssystem zu verbessern. Darüber hinaus ist eine wertvolle Information die von Rate-Systeme (Like und Deslikes) zur Verfügung gestellt. Neben der Korrelation (wenn Sie andere einfache Messungen berücksichtigen möchten, aber nicht unbedingt statistische), können Sie auch den euklidischen Abstand, den Minkowski-Abstand, den Kosinus des Winkels der Vektoren usw. verwenden.

Wenn die Dimension von Ihr Vektor ist hoch, Sie können überlegen, die Abschwächung zu reduzieren, einschließlich der wichtigen Komponenten. Dies kann unter Verwendung von PCA (Hauptkomponentenanalyse) oder Singular Value Decomposition erfolgen.

Allerdings, wenn Sie wirklich verbessern Sie Ihr System in Betracht ziehen sollten Sie sie mit Klassifizierer wie Nearest Neighbors, Decision Trees oder support vector machines und Verwendung betrachten die Klasse Ihrer Käufer zu entdecken. Zum Beispiel kann dies Ihnen helfen zu wissen, ob ein bestimmter Käufer billige oder expansive Marken bevorzugt ...

Schließlich können Sie Online-Experimente mit multi-armed bandit machen.

Es gibt einige Bücher, die Ihnen helfen können:

1) Recommender Systems

2) Bandit algorithm

3) Machine Learning