2
我的程序有兩個內核,第二個內核應該使用已經上傳的輸入數據和第一個內核的結果,所以我可以保存內存傳輸。我將如何歸檔這個?如何讓PyCUDA重用早期內核的內存?
這是我啓動我的內核:
result = gpuarray.zeros(points, dtype=np.float32)
kernel(
driver.In(dataT),result,np.int32(points),
grid = (blocks,1),
block = (block_size, 1, 1),
)