Cuda Streams und Speicher cpyasync, so weit ich weiß, müssen wir verschiedene Kernels, Speicheroperationen zu verschiedenen Streams beschriften, um die GPU-Operationen gleichzeitig mit CPU-Operationen zu machen.Ist es möglich, einen persistenten Cuda Kernel asynchron laufen zu lassen und mit CPU zu kommunizieren?
Aber ist es möglich, einen persistenten Kernel zu haben. Dieser Kernel wird einmalig gestartet, wobei für immer eine Schleife durchlaufen wird und "einige Flags" überprüft werden, um zu sehen, ob ein Datenelement von der CPU kommt, das dann darauf arbeitet. Wenn diese "Stück" -Daten beendet sind, setzt die GPU ein "Flag" auf die CPU, die CPU sieht es und kopiert die Daten zurück. Dieser Kernel wird nie fertig ausgeführt.
Gibt es das im aktuellen Cuda Programmiermodell? Was wird mir am nächsten kommen?