Es ist bekannt, wie kollaboratives Filtern (CF) für Film-, Musik- und Buchempfehlungen verwendet wird. In der Veröffentlichung "Collaborative Topic Modeling for Recommending Scientific Articles" zeigen Autoren unter anderem ein Beispiel für kollaboratives Filtern, das auf ~ 5.500 Benutzer und ~ 17.000 wissenschaftliche Artikel angewendet wird. Bei ~ 200.000 Benutzer-Objekt-Paaren ist die Benutzer-Artikel-Matrix offensichtlich sehr spärlich.Kollaboratives Filtern für Nachrichtenartikel oder Blog-Posts
Was ist, wenn Sie kollaborative Filterung mit matrix factorization für sagen, alle Nachrichtenartikel auf Twitter geteilt? Die Matrix wird noch spärlicher (als im Fall der wissenschaftlichen Artikel), wodurch CF nicht sehr gut anwendbar ist. Natürlich können wir eine inhaltsbewusste Analyse machen (unter Berücksichtigung des Textes eines Artikels), aber das ist nicht mein Fokus. Oder wir können unser Zeitfenster möglicherweise einschränken (z. B. auf alle Nachrichtenartikel, die am letzten Tag oder in der letzten Woche veröffentlicht wurden), um die Benutzerartikelmatrix dichter zu gestalten. Irgendwelche anderen Ideen, wie man die Tatsache bekämpfen kann, dass die Matrix sehr spärlich ist? Was sind die Forschungsergebnisse im Bereich CF für Nachrichtenempfehlungen? Vielen Dank im Voraus!
Was ist das Problem mit Sparse Matrix? Sie meinen, dass die Matrix nicht in den Speicher passt oder die Ergebnisse ungenau sind? – ffriend