gpgpu

-2熱度

1回答

C++頭結構我知道，這個問題可能已經問過，但我找不到特別回答我的問題所以在這裏不言而喻的答案... 的問題是非常簡單的，我正在嘗試爲CUDA（.cu/.cuh）代碼使用C++樣式頭。 //MyClass.cuh #ifndef MY_CLASS #define MY_CLASS #include ...cuda.h, etc. class MyClass { public:

0熱度

1回答

Delaunay三角剖分內整數座標上的雙線性插值

我有一個由約1百萬個三角形組成的平面Delaunay三角剖分。每個頂點都用幾個標量度量標記[1]，我希望在同一個規則網格上看到每個度量的快速簡單插值。作爲參考，我的三角形的聯合覆蓋了約1000萬個具有（整數）座標的網格單元。 [2] 當我說簡單，我的意思是簡單。 Bilinear很好！我的理解是，這是（a）基本上GPU是以什麼爲生，以及（b）可能是無數家庭作業的主題。我自己是公共衛生的政府研究員，

0熱度

1回答

使用CUDA在數組及其索引中查找最小值__shfl_down函數

我正在編寫一個函數，該函數將使用CUDA查找找到值的一維數組的最小值和索引。我通過修改用於查找1d數組中值的總和的約簡代碼開始。代碼適用於求和函數，但我無法找到最小值的工作。如果有任何cuda大師，請在郵件中附上代碼，請指出我正在做的錯誤。實際功能在下面，在測試示例中，數組大小爲1024.因此，我正在使用shuffle reduction部分。問題是每個塊的輸出值在g_oIdxs（給出索引），

0熱度

1回答

正常的指針算術在opencl內核上工作嗎？

例如，這段代碼是否會正常編譯和執行？ int* end = local_buffer + BUFFER_SIZE; for(int* x = local_buffer; x < end; ++x) { ... }

3熱度

1回答

Julia中GPU計算的選項

我正在考慮購買GPU卡以在Julia中嘗試GPU計算。正如我現在看到的，基本上有兩種選擇：NVIDIA或AMD芯片組。我的問題是：是否有與朱莉婭一起使用的推薦選項？由於我是GPU計算的新手，我更關注易用性而不是性能，所以我可以想象當前用作GPU接口的Julia包基本上決定了答案。我使用基於Windows 7的系統。任何幫助表示讚賞。

0熱度

1回答

我如何有效地返回內核malloc數據回到CPU

可以說我malloc一些結構在內核中，我執行了一些計算。然後我想返回這些變量，但是當我初始化內核時，它們並沒有作爲指針發送，所以如果我想返回這些值。我會怎麼做呢？下面的示例代碼。我只是問這是一個普遍的問題，不解決下面的代碼。我遇到過其他問題，我不知道怎麼去解決這個問題。我明白，你可以拋出一個指針並將結果複製到它上面。然而，如果結果的大小不是預先確定的，那麼這將非常困難。所以我在問是否有更好的方法

1熱度

1回答

有什麼辦法可以與Intel GPU一起使用libgpuarray？

我正在尋找一種使用英特爾GPU作爲Theano的GPGPU的方式。我已經安裝了Intel OpenCL和libgpuarray，但測試代碼'python -c「import pygpu; pygpu.test（）」'崩潰了該進程。我發現devname方法造成了它。看來會有更多的錯誤。固定它們很容易工作嗎？我瞭解英特爾OpenCL項目可以使用GPGPU，但它可能不受libgpuarray支持。

0熱度

1回答

GPU內存讀取指令流程，操作數收集器

我想了解GPGPU-Sim的GPU架構，我對內存操作流程感到困惑。假設我有像a = b + c這樣的算術指令。在進行計算之前，b和c需要內存加載操作。將這些指令的加載指令發送到存儲器。首先檢查所有緩存標記。如果未命中，請求將被添加到MSHR並通過互聯網絡從gpu內核發送到較低的內存。當請求從互連網絡返回到內核時，它被添加到某種內存響應FIFO中。然後通過從響應FIFO中彈出這些請求來填充緩存行。

1熱度

1回答

我可以繞過OpenCL緩存嗎？

我實際上從來沒有遇到過需要我寫入全局內存的值被緩存的情況。但是我無法找到阻止GPU污染高速緩存的方法，因爲我可以通過使用非暫時寫入在CPU上執行此操作。這是一個嚴重的問題，可以降低20％或更多的性能。

1熱度

1回答

如何在屏幕會話中使用theano？

我在第一次使用ssh的遠程服務器上使用theano（我沒有該系統上的root）。這工作正常，但是，如果我啓動screen，嘗試導入theano時出現錯誤。使用screen當 >>> import theano Using gpu device 0: GeForce GTX TITAN X (CNMeM is disabled, CuDNN 4007) 行爲：不使用screen時行爲 >>>