cuda

    0熱度

    1回答

    我正在嘗試按照教程發現online。我正在使用Ubuntu 17,從命令行進行編譯。 #include <stdio.h> #include <iostream> __global__ void add(int a, int b, int *c) { *c = a + b; } int main() { int a,b,c; int *d_c;

    0熱度

    1回答

    我有一個程序,包括3個文件,一個.c文件和兩個.cu文件,nn.cu和parallel.cu。主要功能位於一個.cu文件中,nn.cu和.c文件(utils.c)我在parallel.cu中將其作爲extern "C"。我想進一步並行化程序(運行完全沒有cilk),所以我認爲cilk,與_Cilk_spawn和_Cilk_sync: int main(int argc, char* argv[])

    -1熱度

    1回答

    我有兩個問題想要呈現給您。 I) 我有一個.cpp文件,其中是main(),爲了調用內核(在。cu文件),我用的是extern功能的.cu文件,launch(),它調用內核。這兩個文件分別是.cu和.cpp正在編譯成功。從而爲他們結合在一起的,因爲我在CUDA初學者,我想兩件事情: 1)nvcc -Wno-deprecated-gpu-targets -o final file1.cpp file

    2熱度

    1回答

    在Matlab中,當我輸入複數的一維數組時,我輸出的數組具有相同大小和相同維數的實數。 試圖在CUDA C中重複此操作,但具有不同的輸出。 你能幫忙嗎?在Matlab中,當我進入IFFT(陣列) 我arrayOfComplexNmbers: [4.6500 + 0.0000i 0.5964 - 1.4325i 0.4905 - 0.5637i 0.4286 - 0.2976i 0.4345 - 0

    0熱度

    1回答

    我是新的cuda編程,我想建立我的程序,並有一個使用cuda的.cu功能。我參與了這個項目,這個項目非常龐大。項目的* .cpp文件中添加使用腳本files.cmake SUBDIRS( src/ThirdParty/Matrice ) set(SRC_CPP_FILES Operation.cpp Operator.cpp ThirdParty/mt97.cp

    2熱度

    1回答

    我想解決一個使用numba和GPU處理使用CUDA的線性系統。 我已經安裝了所有相關的軟件包並進行了測試,因此看起來我的GPU和CUDA等設置正確。 我的代碼是: import numpy as np import time from numba import vectorize, cuda @vectorize(['float64(float64, float64)'], targe

    3熱度

    2回答

    如果我有兩個cudaMalloc ed數組,我可以通過交換相關指針來交換它們而無需記憶移動。 如果我有兩個CUDA推力device_vectors,說d_a和d_b,我可以通過使用第三temorary向量交換他們,說d_c,但這將需要記憶的動作。 我的問題是:有沒有辦法將CUDA Thrust device_vectors交換爲無內存移動?

    10熱度

    5回答

    我首先使用cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb安裝了cuda。現在,我試圖安裝OpenCV 3.3.0但我發現CMake的錯誤: CMake Error: The following variables are used in this project, but they are set to NOTFOUND. Please se

    0熱度

    1回答

    nvidia-smi命令正確執行,顯示我的服務器的預期GPU設備。但是,當我嘗試運行時鐘CUDA示例時,出現以下錯誤: CUDA時鐘示例 CUDA error at ../../common/inc/helper_cuda.h:1133 code = 30(cudaErrorUnknown) 「cudaGetDeviceCount(& device_count)」 任何想法?

    0熱度

    1回答

    CUDA具有的計數 32位和64位類型的內在函數:__popc()和__popcll()。 CUDA是否也有內在函數來獲取32位和64位類型的奇偶校驗? (該奇偶指的整數是否具有偶數或奇數的1比特量。) 例如,GCC有__builtin_parityl()爲64位整數。 而且這裏的C函數做同樣的事情: inline uint parity64(uint64 n){ n ^= n >> 1