Q

CUDA共享存儲器陣列 - 古怪行爲

2009-07-01 47 views 3 likes

3

在CUDA內核，我具有類似於下面的代碼。我試圖計算每個線程一個分子，並在分塊上累積分子以計算分母，然後返回比率。然而，CUDA被設置爲任何值的塊計算NUMER由線程擁有最大threadIdx.x，而不是在塊穿過的所有線程計算的NUMER值的總和DENOM的價值。有誰知道發生了什麼事？CUDA共享存儲器陣列 - 古怪行爲

extern __shared__ float s_shared[]; 

float numer = //calculate numerator 

s_shared[threadIdx.x] = numer; 
s_shared[blockDim.x] += numer; 
__syncthreads(); 

float denom = s_shared[blockDim.x]; 
float result = numer/denom;

「結果」應始終爲0和1之間，並應在整個塊總和爲1，而是它等於1.0每個線程，其中threadIdx.x爲最大，以及一些其他值並不侷限於到塊中其他線程的範圍。

2009-07-01 Jacob Lyles

A

回答

4

你沒有正確同步求和到blockDim.x位置。在添加總和之前，沒有任何線程正在等待查看別人寫的內容。有點像

大家讀數爲零，
回家，計算零+ NUMER。
EVERONE寫入零+ NUMER到所述存儲器位置

高的threadId勝B/C它具有最後作用的可能性高，我想。

你想做的事，而不是爲了做一個快速的總和什麼，是做對 s_shared[threadIdx.x]

大家二進制和寫入他們的NUMER
一半的線程計算對資金和寫那些到新的位置
線程的四分之一caluclate對對的總和，並寫那些到新的位置
等
直到ÿ OU只是有一個線程和一個總和

這需要O（n）的工作和O（log n）的時間。

2009-07-01 21:23:13 rampion

+4

爲了說明這一點，這裏的邏輯被稱爲簡化。在cuda sdk中有幾個這樣的例子。請參閱：cuda-sdk/C/src/reduction/reduction_kernel.cu – 2010-03-05 19:08:23

相關問題

1. 關於CUDA共享存儲器
2. Python的陣列行爲古怪
3. CUDA共享內存
4. 古怪的行爲
5. CUDA：通過大型2D陣列共享內存
6. 共享內存程序行爲怪異
7. cuda共享內存覆蓋？
8. CUDA共享內存佔用
9. CUDA：共享內存分配
10. 銀行衝突CUDA共享內存？
11. System.Windows.Forms.Keys.HasFlag行爲古怪
12. 具有共享存儲器
13. Date.js：Date.now（）行爲古怪
14. 古怪的行爲
15. 古怪的行爲
16. 軌session_store古怪行爲
17. 的TStringList - 古怪的行爲
18. 使用共享存儲器
19. Andengine精靈古怪行爲
20. scanf的古怪行爲
21. 古怪的cookie行爲
22. SpriteKit SKPhysicsJointFixed古怪行爲
23. 古怪行爲從的ContextMenuStrip
24. JSlider的getValueIsAdjusting古怪行爲
25. CUDA，在共享memroy
26. 多共享存儲器計算機
27. 調用glDrawArrays古怪繪製陣列
28. CUDA共享內存廣播和__syncthreads行爲
29. html.parser古怪的行爲
30. 畫家古怪的行爲