Ich versuche ein Basis-Vorhersagemodell für Filmbewertungen (ähnlich den verschiedenen Grundlinienmodellen aus dem NetFlix-Preis) zu implementieren, mit Parametern, die durch stochastischen Gradientenabfall gelernt werden. Da jedoch beide erklärenden Variablen kategorisch sind (Benutzer und Filme), ist die Design-Matrix sehr groß und kann nicht in mein RAM passen.Stochastic Gradient Descent Design-Matrix zu groß für R
Ich dachte, dass das SGD-Paket automatisch seinen Weg finden würde (da es für große Datenmengen ausgelegt ist), aber das scheint nicht der Fall zu sein.
Kennt jemand einen Weg um dies? Vielleicht eine Möglichkeit, die Design-Matrix als dünne Matrix aufzubauen.
Cheers,
Vielen Dank, ist das xgboost Tutorial wirklich hilfreich! –
Gern geschehen! –