Ich schreibe ein CUDA-Programm für die Bildverarbeitung. Der gleiche Kernel "processOneChannel" wird für RGB-Kanäle gestartet. Im Folgenden versuche ich, Streams für die drei Kernel-Starts anzugeben,
Ich versuche herauszufinden, was genau die von "nvprof" gemeldeten Messwerte sind. Genauer gesagt kann ich nicht herausfinden, welche Transaktionen Systemspeicher und Gerätespeicher lesen und schreibe