Gibt es eine effiziente Möglichkeit, cuBlas zu verwenden, wenn eine große dichte Matrix mit ihrer Transponierten multipliziert wird? Insbesondere gibt es eine Funktion, die die Tatsache nutzt, dass die resultierende Matrix symmetrisch ist, wodurch die Anzahl der Multiplikationen um einen Faktor von ~ 2 reduziert wird.Effiziente Multiplikation der Matrix mit Transponieren mit cuBlas
0
A
Antwort
0
Der Standard BLAS API ?syrk
ist, was Sie brauchen.
C = alpha * A * A^T + beta * C
Für cuBlas ist die API-Namen cublas<t>syrk
. Weitere Informationen finden Sie im Dokument cuBlas
http://docs.nvidia.com/cuda/cublas/index.html#cublas-lt-t-gt-syrk