parallelisieren Wie für Schleifen in CUDA
bei dct vier verschachtelten parallelisieren ich habe vier verschachtelte for-Schleifen möchte ich meine dct Funktion in CUDA-Codewie dct (für Schleifen) in CUDA
for(y = 0; y < HEIGHT; y+=BLOCK_H) {
for(x = 0; x < WIDTH; x+= BLOCK_W) {
for(i = 0; i < BLOCK_H; i++) {
for(j = 0; j < BLOCK_W; j++) {
block_in[i][j] = cur_frame[(x+j)+(WIDTH*(y+i))];
}
}
}
}
Denken Sie Daten, keine Schleifen. Und lies Tutorials. – Drop
[Hier ist] (http://stackoverflow.com/questions/37708101/parallelize-four-and-more-nested-loops-with-cuda) eine Frage, die fragt, wie verschachtelte Schleifen parallelisiert werden. [Hier ist] (http://stackoverflow.com/questions/34529387/kernel-for-processing-a-4tens-in-cuda-) ein anderes. –