gpgpu

    -2熱度

    1回答

    C++頭結構我知道,這個問題可能已經問過,但我找不到特別回答我的問題所以在這裏不言而喻的答案... 的問題是非常簡單的,我正在嘗試爲CUDA(.cu/.cuh)代碼使用C++樣式頭。 //MyClass.cuh #ifndef MY_CLASS #define MY_CLASS #include ...cuda.h, etc. class MyClass { public:

    0熱度

    1回答

    我有一個由約1百萬個三角形組成的平面Delaunay三角剖分。每個頂點都用幾個標量度量標記[1],我希望在同一個規則網格上看到每個度量的快速簡單插值。作爲參考,我的三角形的聯合覆蓋了約1000萬個具有(整數)座標的網格單元。 [2] 當我說簡單,我的意思是簡單。 Bilinear很好!我的理解是,這是(a)基本上GPU是以什麼爲生,以及(b)可能是無數家庭作業的主題。我自己是公共衛生的政府研究員,

    0熱度

    1回答

    我正在編寫一個函數,該函數將使用CUDA查找找到值的一維數組的最小值和索引。 我通過修改用於查找1d數組中值的總和的約簡代碼開始。代碼適用於求和函數,但我無法找到最小值的工作。如果有任何cuda大師,請在郵件中附上代碼,請指出我正在做的錯誤。 實際功能在下面,在測試示例中,數組大小爲1024.因此,我正在使用shuffle reduction部分。問題是每個塊的輸出值在g_oIdxs(給出索引),

    0熱度

    1回答

    例如,這段代碼是否會正常編譯和執行? int* end = local_buffer + BUFFER_SIZE; for(int* x = local_buffer; x < end; ++x) { ... }

    3熱度

    1回答

    我正在考慮購買GPU卡以在Julia中嘗試GPU計算。正如我現在看到的,基本上有兩種選擇:NVIDIA或AMD芯片組。 我的問題是:是否有與朱莉婭一起使用的推薦選項?由於我是GPU計算的新手,我更關注易用性而不是性能,所以我可以想象當前用作GPU接口的Julia包基本上決定了答案。 我使用基於Windows 7的系統。任何幫助表示讚賞。

    0熱度

    1回答

    可以說我malloc一些結構在內核中,我執行了一些計算。然後我想返回這些變量,但是當我初始化內核時,它們並沒有作爲指針發送,所以如果我想返回這些值。我會怎麼做呢?下面的示例代碼。 我只是問這是一個普遍的問題,不解決下面的代碼。我遇到過其他問題,我不知道怎麼去解決這個問題。我明白,你可以拋出一個指針並將結果複製到它上面。然而,如果結果的大小不是預先確定的,那麼這將非常困難。所以我在問是否有更好的方法

    1熱度

    1回答

    我正在尋找一種使用英特爾GPU作爲Theano的GPGPU的方式。 我已經安裝了Intel OpenCL和libgpuarray,但測試代碼'python -c「import pygpu; pygpu.test()」'崩潰了該進程。我發現devname方法造成了它。看來會有更多的錯誤。 固定它們很容易工作嗎?我瞭解英特爾OpenCL項目可以使用GPGPU,但它可能不受libgpuarray支持。

    0熱度

    1回答

    我想了解GPGPU-Sim的GPU架構,我對內存操作流程感到困惑。假設我有像a = b + c這樣的算術指令。在進行計算之前,b和c需要內存加載操作。將這些指令的加載指令發送到存儲器。首先檢查所有緩存標記。 如果未命中,請求將被添加到MSHR並通過互聯網絡從gpu內核發送到較低的內存。當請求從互連網絡返回到內核時,它被添加到某種內存響應FIFO中。然後通過從響應FIFO中彈出這些請求來填充緩存行。

    1熱度

    1回答

    我實際上從來沒有遇到過需要我寫入全局內存的值被緩存的情況。但是我無法找到阻止GPU污染高速緩存的方法,因爲我可以通過使用非暫時寫入在CPU上執行此操作。 這是一個嚴重的問題,可以降低20%或更多的性能。

    1熱度

    1回答

    我在第一次使用ssh的遠程服務器上使用theano(我沒有該系統上的root)。這工作正常,但是,如果我啓動screen,嘗試導入theano時出現錯誤。使用screen當 >>> import theano Using gpu device 0: GeForce GTX TITAN X (CNMeM is disabled, CuDNN 4007) 行爲:不使用screen時 行爲 >>>