2016-09-24 99 views
0

有沒有辦法檢查我的內核讀取和寫入是否以合併的方式從/到全局內存?我一直在試圖確保我的內核有效地讀寫內存以獲得更好的性能。在CUDA中合併讀取/寫入

感謝

回答

4

使用分析器如nvprof

的gld_efficiency和gst_efficiency指標會給你合併的全局負載和存儲的百分比的直接測量。例如在Linux上:

nvprof --metrics gld_efficiency,gst_efficiency ./my_app