Ich versuche ein Empfehlungssystem zu erstellen, das dem Benutzer Webseiten basierend auf seinen Aktionen empfiehlt (Google-Suche, Klicks, kann er auch Webseiten explizit bewerten). Um eine Vorstellung davon zu bekommen, wie Google News es macht, zeigt es Nachrichtenartikel aus dem Web zu einem bestimmten Thema an. In technischer Hinsicht ist das Clustering, aber mein Ziel ist ähnlich. Es wird eine inhaltsbasierte Empfehlung basierend auf der Aktion des Benutzers sein.Webseiten-Empfehlungssystem
Also meine Fragen sind:
- Wie kann ich das Internet möglicherweise Schleppnetz verwandte Web-Seiten zu finden?
- Und welchen Algorithmus sollte ich verwenden, um Daten von der Webseite zu extrahieren, ist Textanalyse und Worthäufigkeit der einzige Weg, es zu tun?
- Zuletzt welche Plattform für dieses Problem am besten geeignet ist. Ich habe von Apache Mahout gehört und es kommt mit einigen wiederverwendbaren Algos, klingt es wie eine gute Passform?
können Sie mehrere Bücher über Ihre Fragen schreiben. –
Haha, klingen sie wie große Probleme? Nun, ich suche nach einer einfachen Lösung. Nur eine kurze Beschreibung, wie man sich einem solchen Projekt nähert. –
[Programmierung Collective Intelligence] (http://shop.oreilly.com/product/9780596529321.do) ist eine einfache, mathematische Einführung in Machine Learning und enthält einen Anwendungsfall wie Ihre Frage. – Maurits