2
A
回答
2
與Nsight剖析當前確實禁用並行內核,因此要獲得準確的計時,您需要使用事件追蹤時機。
您可以像預期的那樣使用事件,並且可以使用cudaStreamWaitEvent()
使流等待另一個流中的事件。有關更多信息,請參見CUDA Reference Manual第4.5.2.5節。
相關問題
- 1. CUDA並行內核執行,每個流有多個內核
- 2. 優化Cuda內核時間執行
- 3. CUDA 2D內核合併內存
- 4. 配置文件併發CUDA內核
- 5. 調試CUDA內核
- 6. CUDA內核函數
- 7. CUDA內核掛起
- 8. CUDA內核參數
- 9. 內核運行時CUDA內存上的MVAPICH死鎖
- 10. CUDA在內核執行後釋放內存時出錯
- 11. CUDA:寫入共享內存increses內核時執行了很多
- 12. cuda內核不能執行所有blockIdx
- 13. 用超時啓動CUDA內核
- 14. 編程cuda內核時整數大小
- 15. 併發CUDA內核執行的優先級
- 16. CUDA內核只啓動並運行在某些網格大小
- 17. 多個進程並行啓動CUDA內核
- 18. 測量CUDA程序和CUDA內核耗用時間的問題
- 19. CUDA:內核CRT的文檔?
- 20. CUDA內核不重疊
- 21. CUDA內核不啓動
- 22. Uncrustify命令CUDA內核
- 23. CUDA內核中的STD類
- 24. 內核中的CUDA流ID
- 25. CUDA中的嵌套內核
- 26. CUDA內核的參數
- 27. 診斷CUDA內核問題
- 28. CUDA - 多次調用內核
- 29. CUDA內核內部的內存分配
- 30. 您能預測CUDA內核的運行時間嗎?