我一直在玩弄numba並嘗試實現一個簡單的基於元素的矩陣乘法。當使用'vectorize'時,我會得到與numpy乘法相同的結果,但是當我使用'cuda.jit'時,它們不相同。其中許多是零。我爲此提供了一個最低工作示例。任何有關問題的幫助將不勝感激。我正在使用numba o.35.0和python 2.7 from __future__ import division
from __futur
我很抱歉如果這個問題已經被解決了,但我已經做了一些搜索,到目前爲止我已經空手而歸了。我試圖編譯一個cuda版本的Hello World,從here稍微修改。我的代碼是: // This is the REAL "hello world" for CUDA!
// It takes the string "Hello ", prints it, then passes it to CUDA wit