使用CUDA創建鏈接列表

使用CUDA可以在GPU上創建鏈接列表嗎？
我正在努力做到這一點，我正在爲此遇到一些困難。
如果我不能在CUDA內核中分配動態內存，那我該如何創建一個新節點並將其添加到鏈接列表中？使用CUDA創建鏈接列表

2010-10-20 scatman

如果你能幫上忙，你真的不想這麼做 - 如果你無法擺脫鏈表，你可以做的最好的事情就是通過數組來模擬它們，並使用數組索引而不是指針鏈接。

2010-10-20 07:00:21

作者沒有提供證據或解釋爲什麼不使用LL。您可以在GPU上使用指針創建LL。需要這些類型的結構，因爲我們在GPU上執行更復雜的算法。使用數組下標作爲LL的唯一必要條件是您需要將LL存儲在整個存儲空間中。 – 2013-08-03 14:10:15

我同意Paul的觀點，鏈表是一種非常「連續」的思維方式。忘記你所學到的有關串行操作，只是做的一切在一次：）

2010-10-22 13:28:35 Marm0t

在GPU和並行編程中有很多LL的有效使用。我將它們用於哈希，索引，壓縮和搜索算法算法。通過GPU上的LL，每秒可以獲得> 100M插入... – 2013-08-03 14:14:54

看看Thrust做常見的操作

2010-10-29 23:47:47 fabrizioM

有一些有效的使用情況在GPU上鍊表的方式。考慮使用跳過列表作爲替代，因爲它們提供更快的操作。有幾個高度併發的跳過列表算法可以通過Google搜索獲得。

看看這個鏈接http://www.cse.iitk.ac.in/users/mainakc/lockfree.html/ 爲CUDA代碼一個PDF和PPT演示在一些無鎖的CUDA數據結構。

鏈接列表可以使用簡化算法方法並行構建。這假定所有成員在施工時已知。每個線程從連接2個節點開始。然後有一半線程將2個節點段連接在一起，等等，每次迭代減少2個線程數。這將在log2 N時間內建立一個列表。

內存分配是一個約束。預分配主機上陣列中的所有節點。然後你可以使用數組下標代替指針。這具有列表遍歷在GPU和主機上有效的優點。

對於併發性，您需要使用CUDA原子操作。通過原子添加/增加來計算從節點陣列中使用的節點以及比較和交換以設置節點之間的鏈接。

再次仔細考慮用例和訪問模式。使用一個大的鏈表是非常連續的。使用100-100的小鏈表更加平行。我期望內存訪問不合並，除非注意分配相鄰內存位置中的連接節點。

2013-05-15 14:19:18

回答