Ich habe eine OpenCL-Anwendung, die die Fähigkeiten von Intel Xeon Phi zu wenig nutzt.Concurrent Simulationen mit OpenCL auf Intel Xeon Phi
Der Kernel verwendet eine Datenbank für einige statistische Berechnungen. Daher denke ich, wenn es möglich ist, einen zweiten Kernel hinzuzufügen, der dieselbe Datenbank verwendet und sie gleichzeitig auf Phi ausführt.
Z. B bis n/2 Gewinde für Kernel 1 verwenden und n/2 Fäden für Kernel 2 usw.
Irgendwelche Vorschläge?
Geben Sie Ihren Code ein. –