Ich frage mich über NVIDIAs cuBLAS-Bibliothek. Hat jemand Erfahrung damit? Wenn ich zum Beispiel ein C-Programm mit BLAS schreibe, kann ich die Aufrufe von BLAS durch Aufrufe von cuBLAS ersetzen? Oder
Für eine Matrix A Transponieren der documentation besagt nur, daß die entsprechenden führenden Dimensionsparameter lda bezieht sich auf die: führende Dimension der zweidimensionalen Anordnung verwende
frage ich mich, wenn es einen Unterschied zwischen beträgt: // cumalloc.c - Create a device on the device
HOST float * cudamath_vector(const float * h_vector, const int m)
{
float *d_vector = N
CUDA Runtime verfügt über eine Komfortfunktion cudaGetErrorString(cudaError_t error), die eine Fehleraufzählung in eine lesbare Zeichenfolge übersetzt. cudaGetErrorString wird im Makro CUDA_SAFE_CALL(