cuda

    0熱度

    1回答

    將設備設置爲1時,以及將設備上的'ptr'複製到'host_ptr'之前,必須將設備重新設置爲1,才能將ptr置入? cudaSetDevice(1); cudaMalloc(ptr, size); //do something here ... cudaSetDevice(0); //do something here ... //cudaSetDevice(1); #My

    1熱度

    3回答

    所以我有一個struct如下所示,我想創建一個該結構的數組併爲其分配內存(使用malloc)。 typedef struct { float *Dxx; float *Dxy; float *Dyy; } Hessian; 我的第一反應是爲整個結構分配內存,但隨後,相信內部陣列(Dxx,Dxy,Dyy)將不會被分配。如果我一個一個地分配內部數組,那麼數組的結構將

    0熱度

    1回答

    我嘗試新的PGI社區版本(17.4)與玩具的例子(見下文)並調用acc_init的時候,我發現了CUDA驅動程序API內部錯誤後返回CUDA_ERROR_INVALID_DEVICE。 重現該錯誤的代碼是: #include <openacc.h> #include <cuda_runtime_api.h> #include <stdio.h> int main() { acc

    0熱度

    1回答

    我是CUDA和CUB的新手。我發現下面的代碼,並試圖編譯它,但我有這個錯誤: 致命錯誤:cub/cub.cuh:沒有這樣的文件或目錄。 CUDA的版本是7.0.27 我該如何解決這個錯誤? 謝謝!所有的 #include <cuda.h> #include <cub/cub.cuh> #include <stdio.h> int main(){ // Declare, allo

    1熱度

    1回答

    我試圖編寫CUDA版本的serial代碼作爲在分子動力學算法中實現週期性邊界條件的一部分。這個想法是,有一小部分位置在框外的粒子需要使用兩個ways中的一個來重新使用,並限制我使用第一種方式的次數。 本質上,它歸結爲以下MWE。我有一個數組x[N],其中N很大,並且代碼如下serial。 #include <cstdlib> int main() { int N =30000;

    2熱度

    1回答

    我試圖讓使用NVCC選項 --ptxas-options=v我CUDA內核有關的寄存器使用情況的信息,並同時與全球功能一切正常,我有一些困難由於 ptxas info : Used N registers 線設備那些缺少在輸出中。我試圖使用noinline關鍵字,並將它們保存在另一個文件中,與調用全局函數有關,因爲我認爲NVCC報告了全局函數的全部註冊使用情況,包括內聯後的被調用設備的全局函數,但

    0熱度

    1回答

    我剛開始學習如何使用CUDA API和我開始與這個導入引導部分配內存時的寫入位置誤差:https://devblogs.nvidia.com/parallelforall/even-easier-introduction-cuda/ 我下面的教程,但我想以後與cudaMallocManaged()我想初始化數組分配內存,而是試圖初始化數組時,拋出一個異常,它說: 異常在VectorAdd.exe在

    0熱度

    1回答

    我試圖將double數組複製到設備上的一塊常量內存。但是得到cudaInvalidValue錯誤。 這是我的代碼。 #define kCIELEN 95 // length of CIE_X[] const double CIE_X[] = { 1.299000e-04, 2.321000e-04, 4.149000e-04, 7.416000e-04, 1.368000e-03,

    0熱度

    1回答

    我的程序可以很好地編譯和編譯。然而,當我嘗試運行使用Nsight,我收到以下錯誤性能分析: 這是我從VS2015做: Nsight - >啓動性能分析 - >選擇CUDA跟蹤設置 - >啓動 我不確定這是否相關,但我試圖刪除c:\ temp文件夾的只讀屬性,但它不起作用。現在它說只讀(只適用於文件夾中的文件)

    0熱度

    1回答

    我已使用此link中的代碼查詢設備中可用的全局內存量,但返回值爲零。 設備上可能沒有全局內存(DRAM)? the output