我用x
& y
用於計算設備中矩陣的單元。 當我使用lenA & lenB超過32時,斷點(在設備代碼中的int x= threadIdx.x;
)不能工作,輸出不正確。塊中的線程數
在主機代碼:
int lenA=52;
int lenB=52;
dim3 threadsPerBlock(lenA, lenB);
dim3 numBlocks(lenA/threadsPerBlock.x, lenB/threadsPerBlock.y);
kernel_matrix<<<numBlocks,threadsPerBlock>>>(dev_A, dev_B);
在設備代碼:
int x= threadIdx.x;
int y= threadIdx.y;
...
你忘了問一個問題...... – talonmies 2013-05-13 19:24:37
爲什麼lenA或lenB斷點超過32個值無法正常工作,程序的答案是錯誤的,但是小於32的話一切正常?我是否需要一種不同的方法來初始化x&y? – mahdimb 2013-05-13 19:32:42
這應該寫入您的問題,而不是作爲評論下降。請記住,這個問題和答案同樣存在於下一個與你的幫助相同的問題。 – talonmies 2013-05-14 05:52:02