Ich kann Warp_execution_efficiency für jeden Kernel erhalten, aber wie kann ich vollständige warp_execution_efficiency meines Programms erhalten?CUDA Warp Execution Efficiency
0
A
Antwort
2
Hinweis: Es ist unwahrscheinlich, dass die Berechnung einer einzigen Zahl in allen Kerneln für Optimierungszwecke nützlich ist.
NVIDIAs Profiler ist kernelzentriert, daher ist eine direkte Abfrage dieser Informationen nicht möglich. Sie können jedoch nvprof --csv --metrics warp_execution_efficiency
ausführen, dann die Ausgabe in Excel, R oder Ihre Lieblings-Statistik-Software legen und damit herumspielen.
Ein Problem damit ist, dass Warp_execution_efficiency einen Durchschnitt beinhaltet, so dass Sie nicht einfach den Durchschnitt nehmen können. Sie können möglicherweise einige praktische Visualisierungen abrufen, die der Visual Profiler nicht bietet.