cuda

0熱度

1回答

將設備設置爲1時，以及將設備上的'ptr'複製到'host_ptr'之前，必須將設備重新設置爲1，才能將ptr置入？ cudaSetDevice(1); cudaMalloc(ptr, size); //do something here ... cudaSetDevice(0); //do something here ... //cudaSetDevice(1); #My

1熱度

3回答

如何爲陣列結構的陣列分配內存

所以我有一個struct如下所示，我想創建一個該結構的數組併爲其分配內存（使用malloc）。 typedef struct { float *Dxx; float *Dxy; float *Dyy; } Hessian; 我的第一反應是爲整個結構分配內存，但隨後，相信內部陣列（Dxx，Dxy，Dyy）將不會被分配。如果我一個一個地分配內部數組，那麼數組的結構將

0熱度

1回答

cuDevicePrimaryCtxRetain acc_init

我嘗試新的PGI社區版本（17.4）與玩具的例子（見下文）並調用acc_init的時候，我發現了CUDA驅動程序API內部錯誤後返回CUDA_ERROR_INVALID_DEVICE。重現該錯誤的代碼是： #include <openacc.h> #include <cuda_runtime_api.h> #include <stdio.h> int main() { acc

0熱度

1回答

致命錯誤：cub/cub.cuh：沒有這樣的文件或目錄

我是CUDA和CUB的新手。我發現下面的代碼，並試圖編譯它，但我有這個錯誤：致命錯誤：cub/cub.cuh：沒有這樣的文件或目錄。 CUDA的版本是7.0.27 我該如何解決這個錯誤？謝謝！所有的 #include <cuda.h> #include <cub/cub.cuh> #include <stdio.h> int main(){ // Declare, allo

1熱度

1回答

Cuda原子和條件分支

我試圖編寫CUDA版本的serial代碼作爲在分子動力學算法中實現週期性邊界條件的一部分。這個想法是，有一小部分位置在框外的粒子需要使用兩個ways中的一個來重新使用，並限制我使用第一種方式的次數。本質上，它歸結爲以下MWE。我有一個數組x[N]，其中N很大，並且代碼如下serial。 #include <cstdlib> int main() { int N =30000;

2熱度

1回答

NVCC寄存器使用情況報告

我試圖讓使用NVCC選項 --ptxas-options=v我CUDA內核有關的寄存器使用情況的信息，並同時與全球功能一切正常，我有一些困難由於 ptxas info : Used N registers 線設備那些缺少在輸出中。我試圖使用noinline關鍵字，並將它們保存在另一個文件中，與調用全局函數有關，因爲我認爲NVCC報告了全局函數的全部註冊使用情況，包括內聯後的被調用設備的全局函數，但

0熱度

1回答

我得到訪問衝突嘗試使用CUDA

我剛開始學習如何使用CUDA API和我開始與這個導入引導部分配內存時的寫入位置誤差：https://devblogs.nvidia.com/parallelforall/even-easier-introduction-cuda/ 我下面的教程，但我想以後與cudaMallocManaged()我想初始化數組分配內存，而是試圖初始化數組時，拋出一個異常，它說：異常在VectorAdd.exe在

0熱度

1回答

cuda-cudaInvalidValue error當cudaMemcpyToSymbol

我試圖將double數組複製到設備上的一塊常量內存。但是得到cudaInvalidValue錯誤。這是我的代碼。 #define kCIELEN 95 // length of CIE_X[] const double CIE_X[] = { 1.299000e-04, 2.321000e-04, 4.149000e-04, 7.416000e-04, 1.368000e-03,

0熱度

1回答

嘗試在Visual Studio中使用Nsight時，「訪問路徑被拒絕」？

我的程序可以很好地編譯和編譯。然而，當我嘗試運行使用Nsight，我收到以下錯誤性能分析：這是我從VS2015做： Nsight - >啓動性能分析 - >選擇CUDA跟蹤設置 - >啓動我不確定這是否相關，但我試圖刪除c：\ temp文件夾的只讀屬性，但它不起作用。現在它說只讀（只適用於文件夾中的文件）

0熱度

1回答

如何查詢全局內存的數量？

我已使用此link中的代碼查詢設備中可用的全局內存量，但返回值爲零。設備上可能沒有全局內存（DRAM）？ the output