1
即時編寫開放cl植絨,我有奇怪的問題。在Kernel Execute之前,clEnqueueReadBuffer從gpu mem讀取程序mem 20000數組float,沒有問題,速度非常快,但是在內核執行後,它在傳遞的數組上執行了一些操作,readbuffer持續太久(〜150 ms)。爲什麼?在這兩種情況下,陣列都充滿了數據。我的內核在幹什麼可能是錯的? (通過數組是__global)。打開CL clEnqueueReadBuffer執行時間
在內核執行之前,gpu內存是如何充滿數據的? – ardiyu07 2012-05-31 01:25:12