cuda

0熱度

1回答

我正在嘗試按照教程發現online。我正在使用Ubuntu 17，從命令行進行編譯。 #include <stdio.h> #include <iostream> __global__ void add(int a, int b, int *c) { *c = a + b; } int main() { int a,b,c; int *d_c;

0熱度

1回答

Cilk和CUDA的組合和彙編

我有一個程序，包括3個文件，一個.c文件和兩個.cu文件，nn.cu和parallel.cu。主要功能位於一個.cu文件中，nn.cu和.c文件（utils.c）我在parallel.cu中將其作爲extern "C"。我想進一步並行化程序（運行完全沒有cilk），所以我認爲cilk，與_Cilk_spawn和_Cilk_sync： int main(int argc, char* argv[])

-1熱度

1回答

CUDA和C++鏈接/編譯，cudaMalloc上的程序崩潰

我有兩個問題想要呈現給您。 I）我有一個.cpp文件，其中是main()，爲了調用內核（在。cu文件），我用的是extern功能的.cu文件，launch()，它調用內核。這兩個文件分別是.cu和.cpp正在編譯成功。從而爲他們結合在一起的，因爲我在CUDA初學者，我想兩件事情： 1）nvcc -Wno-deprecated-gpu-targets -o final file1.cpp file

2熱度

1回答

如何：CUDA IFFT

在Matlab中，當我輸入複數的一維數組時，我輸出的數組具有相同大小和相同維數的實數。試圖在CUDA C中重複此操作，但具有不同的輸出。你能幫忙嗎？在Matlab中，當我進入IFFT（陣列）我arrayOfComplexNmbers： [4.6500 + 0.0000i 0.5964 - 1.4325i 0.4905 - 0.5637i 0.4286 - 0.2976i 0.4345 - 0

0熱度

1回答

Cmake錯誤使用cuda_add_executable命令

我是新的cuda編程，我想建立我的程序，並有一個使用cuda的.cu功能。我參與了這個項目，這個項目非常龐大。項目的* .cpp文件中添加使用腳本files.cmake SUBDIRS( src/ThirdParty/Matrice ) set(SRC_CPP_FILES Operation.cpp Operator.cpp ThirdParty/mt97.cp

2熱度

1回答

用numba和CUDA解決使用Python的線性系統

我想解決一個使用numba和GPU處理使用CUDA的線性系統。我已經安裝了所有相關的軟件包並進行了測試，因此看起來我的GPU和CUDA等設置正確。我的代碼是： import numpy as np import time from numba import vectorize, cuda @vectorize(['float64(float64, float64)'], targe

3熱度

2回答

交換CUDA無記憶移動的推力設備向量

如果我有兩個cudaMalloc ed數組，我可以通過交換相關指針來交換它們而無需記憶移動。如果我有兩個CUDA推力device_vectors，說d_a和d_b，我可以通過使用第三temorary向量交換他們，說d_c，但這將需要記憶的動作。我的問題是：有沒有辦法將CUDA Thrust device_vectors交換爲無內存移動？

10熱度

5回答

CMake錯誤：變量設置爲NOTFOUND

我首先使用cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb安裝了cuda。現在，我試圖安裝OpenCV 3.3.0但我發現CMake的錯誤： CMake Error: The following variables are used in this project, but they are set to NOTFOUND. Please se

0熱度

1回答

nvidia-smi看起來不錯，但獲取代碼= 30（cudaErrorUnknown）「cudaGetDeviceCount（＆device_count）」

nvidia-smi命令正確執行，顯示我的服務器的預期GPU設備。但是，當我嘗試運行時鐘CUDA示例時，出現以下錯誤： CUDA時鐘示例 CUDA error at ../../common/inc/helper_cuda.h:1133 code = 30（cudaErrorUnknown）「cudaGetDeviceCount（& device_count）」任何想法？

0熱度

1回答

CUDA中的計算位奇偶校驗

CUDA具有的計數 32位和64位類型的內在函數：__popc()和__popcll()。 CUDA是否也有內在函數來獲取32位和64位類型的奇偶校驗？（該奇偶指的整數是否具有偶數或奇數的1比特量。）例如，GCC有__builtin_parityl()爲64位整數。而且這裏的C函數做同樣的事情： inline uint parity64(uint64 n){ n ^= n >> 1