2013-03-05 121 views

回答

5

__syncthreads() - >barrier(_)但一定要了解barrier(CLK_LOCAL_MEM_FENCE)barrier(CLK_GLOBAL_MEM_FENCE) 檢查這個question或本documentation更多信息之間的差異。

blockIdx.x - >get_group_id(0),這將給你的組/塊的第一個/ x維度ID

0

有網絡上的很多網頁,可以幫助你移植到CUDA OpenCL的(例如here)。我只想說一句,因爲它指出here爲「障礙」,有barrier(CLK_LOCAL_MEM_FENCE)barrier(CLK_GLOBAL_MEM_FENCE):主要不同之處在於,當您使用本地(在CUDA中共享)內存時,第一個確保內存操作的正確排序第二次是在全局內存上運行。一定要爲你的情況使用正確的。

相關問題