Ich versuche, ein Artikel-basiertes Empfehlungssystem aus dem yelp-Datensatz zu erstellen. Ich habe es geschafft, die Daten in einem Umfang zu verarbeiten, in dem ich die Bewertungen aller Nutzer habe, die ein Restaurant in einem bestimmten Staat bewertet haben. Schließlich möchte ich zu dem Punkt kommen, wo ich eine Bewertungsmatrix mit Restaurants auf einer Achse und Benutzern auf der anderen und Bewertungen (1-5) in der Mitte (Null für fehlende Bewertungen) habe.Einen pandas-Datenrahmen neu anordnen, um eine 2d-Bewertungsmatrix zu erstellen
Im Moment sieht die DF wie folgt aus:
user_id review_id business_id stars
0 Xqd0DzHaiyRqVH3WRG7 15SdjuK7DmYqUAj6rjGowg vcNAWiLM4dR7D2nwwJ7nCA 5
1 Xqd0DzHaiyRqVH3WRG7 15SdjuK7DmYqUAj6rjGowg vcNAWiLM4dR7D2nwwJ7nCA 5
2 H1kH6QZV7Le4zqTRNxo RF6UnRTtG7tWMcrO2GEoAg vcNAWiLM4dR7D2nwwJ7nCA 2
3 zvJCcrpm2yOZrxKffwG -TsVN230RCkLYKBeLsuz7A vcNAWiLM4dR7D2nwwJ7nCA 4
4 KBLW4wJA_fwoWmMhiHR dNocEAyUucjT371NNND41Q vcNAWiLM4dR7D2nwwJ7nCA 4
5 zvJCcrpm2yOZrxKffwG ebcN2aqmNUuYNoyvQErgnA vcNAWiLM4dR7D2nwwJ7nCA 4
6 Qrs3EICADUKNFoUq2iH _ePLBPrkrf4bhyiKWEn4Qg vcNAWiLM4dR7D2nwwJ7nCA 1
aber ich würde es ein bisschen mehr so aussehen mag:
(4 Restaurants x 5 User)
0 4 3 4 5
3 3 3 2 1
1 2 3 4 5
0 5 3 3 4
Es wäre besser, wenn Sie hier ein Copy-Pastable-Beispiel einfügen. Sie benötigen etwas wie einen Pivot, aber Yelp-Dataset ist wirklich spärlich, so dass Sie Speicherprobleme haben könnten. Diese Struktur kann geeigneter sein. – ayhan
Wie anstelle des Links zum Bild? Ich bin nicht sicher, wie, aber ich kann versuchen – mmera
Ich denke, das Beste ist Beispiel mit Dummy-Daten wie 'df = pd.DataFrame ({'A': ['a', 'b', 'c', 'c'] , 'B': ['g', 'h', 'f', 'p'], 'C': [7,8,9,1]}) ', versuchen Sie es bei Bedarf zu modifizieren. Vergessen Sie auch nicht, die gewünschte Ausgabe hinzuzufügen. – jezrael