Angesichts einer MatrixFactorizationModel, was wäre der effizienteste Weg, um die vollständige Matrix der Benutzer-Produkt-Vorhersagen (in der Praxis, durch einen bestimmten Schwellenwert gefiltert, um Sparsity zu erhalten) zurückgeben?Wie bewertet man alle Benutzer-Produkt-Kombinationen im Spark MatrixFactorizationModel?
Über die aktuelle API könnte einmal ein kartesisches Produkt von Benutzer-Produkt an die Vorhersage-Funktion übergeben werden, aber es scheint mir, dass dies eine Menge zusätzlicher Verarbeitung tun wird.
Würde der Zugriff auf die privaten userFeatures, productFeatures der richtige Ansatz sein, und wenn ja, gibt es eine gute Möglichkeit, andere Aspekte des Frameworks zu nutzen, um diese Berechnung effizient zu verteilen? Gibt es einen einfachen Weg, besser zu tun, als alle Paare von userFeature, productFeature "von Hand" zu multiplizieren?
Ja, es ist eine große Operation, weshalb es die Mühe wert schien weiter zu optimieren, um zu versuchen. Danke für die Vorschläge! – cohoz