Die Datenrate von cudaMemcpy
Operationen wird stark von der Anzahl der PCI-e 3.0 (oder 2.0) Lanes beeinflusst, die zugewiesen sind, um von der CPU zur GPU zu laufen. Ich bin gespannt, wie PCI-e-Lanes auf Nvidia-Geräten mit zwei GPUs verwendet werden.PCI-e-Spurbelegung auf 2-GPU-Karten?
Nvidia hat ein paar Produkte, die zwei GPUs auf einem einzigen PCI-e-Gerät haben. Zum Beispiel:
- Die GTX 590 enthält zwei Fermi GF110-GPUs
- Die GTX 690 enthält zwei Kepler GK104-GPUs
Wie bei vielen neueren Grafikkarten, diese Geräte in PCI-e 16
Schlitze montieren. Für Karten, die nur eine GPU enthalten, kann die GPU 16 PCI-e-Lanes verwenden.
Wenn ich ein Gerät mit zwei GPUs (wie die GTX 690), aber ich bin mit nur Rechenaufträge auf nur ein der GPUs können alle 16 PCI-e Bahnen dienen dazu, die eine GPU, dass wird verwendet?
diese Kunst als ascii Um zu zeigen, ...
[ GTX690 (2x GF110) ] ------ 16 PCI-e Fahrspuren ----- [ CPU ]
ich spreche nicht über den Fall wo die CPU mit zwei Karten verbunden ist, die jeweils eine GPU haben. (Wie das folgende Diagramm)
[ GTX670 (1x GK104) ] ------ PCI-e Fahrspuren ----- [ CPU ] ------ PCI -e Fahrspuren ----- [ GTX670 (1x GK104) ]