cuda

    0熱度

    1回答

    CUDA 8.0 cudaMemcpy()是否同時複製整個內存塊,或逐字節複製? 我想限制複印時間,但我無法在文檔中找到任何指定cudaMemcpy()是線性還是恆定時間操作的內容。

    0熱度

    1回答

    我有一個二進制圖像,將有一個或多個blob。我想要每個blob的像素列表。如果我可以爲每個blob找到一個種子點,我可以通過填充來查找blob的像素。 對這個問題做了一些研究,我想我想要的算法是「連接組件標籤」。我看到的大多數示例只是對Blob輸出進行顏色編碼。使用這種算法,我可以收集:blob上的一個點和blob的軸對齊邊界框? 連接的組件標籤聽起來像是我需要的正確算法嗎?有沒有人有一個很好的C

    -1熱度

    1回答

    我寫了一個函數swap來方便地交換設備數組指針,但它不工作,我假設我交換交換功能中的本地數組指針,而不是我傳遞給它的那些指針。 __global__ void device_add_one(float *A, float *B) { for (int index = blockIdx.x * blockDim.x + threadIdx.x; index < N;

    0熱度

    1回答

    我試圖安裝mxnet GPU軟件包,但失敗了。於是,我開始使用CPU來代替。但是,我遇到了這個問題,打開R和Rstudio時出現錯誤。 我已經搜索發現cufft64_80.dll在CUDA庫中,但我無法在Windows中安裝NVIDIA CUDA 8.0。 我該如何處理?有一些地方我可以下載這個DLL嗎? 在此先感謝!

    0熱度

    1回答

    如何在 Evaluating expressions consisting of elementwise matrix operations in Thrust 僅供參考編譯樣本CUDA牛頓元編程程序,牛頓是在這裏:https://github.com/jaredhoberock/newton 這裏開始我的輸出: nvcc -I. -I/local/cuda/include test_newton

    0熱度

    1回答

    我的GPU是NVIDIA GeForce GT440,其計算能力版本是2.x. NVIDIA的官方CUDA_C_Programming_Guide指出 限制1.每塊= 1024 限制2.每多居民的最大線程數的最大線程數= 1536 但是,有兩個OpenGL的計算機着色器實現限制是 極限3. GL_MAX_COMPUTE_WORK_GROUP_INVOCATIONS = 1536 我的問題是 1.爲

    -1熱度

    1回答

    我想用cublasDgemm()來計算矩陣的乘積的乘積。輸入矩陣和輸出我從我的代碼期待有以下幾種(A和C分別): | 1 4 7 | | 66 78 | A = | 2 5 8 | C = | 78 93 | 不過我得到奇怪的結果,這是一個有點困難我理解維度CUBLAS/CUDA用途(專欄)。任何提示將不勝感激! #include <stdio.h> #include <stdlib.h

    0熱度

    1回答

    我想在cuda中實現關鍵部分。我在這個主題上閱讀了很多問題和答案,答案通常涉及到atomicCAS和atomicExch。 然而,這並不在經一級的工作,因爲在經所有線程獲取該atomicCAS後相同的鎖,從而導致死鎖。 我覺得有一種方法有使用經__ballot或__any指令CUDA一個真正的鎖。 然而,多次嘗試後,我沒有得到一個滿意的(讀工作)解決方案。 有沒有人在這裏有一個很好的答案呢? PS

    -1熱度

    1回答

    我已經寫了下面的代碼 #include "cuda_runtime.h" #include "device_launch_parameters.h" #include <stdio.h> #include<iostream> using namespace std; __global__ void hello() { printf("Hello"); } int ma

    1熱度

    1回答

    我有一些舊的代碼,我繼承了,我想升級到最新的cuda,所以我安裝了Cuda 8,但編譯它時抱怨無法找到npp.lib,我檢查了C:\ Program Files \ NVIDIA GPU Computing Toolkit \ CUDA \ v8.0 \ lib \ x64並找不到它,我看到一堆npp {xxx} .lib,其中xxx是更多文本,但沒有什麼只是npp.lib。這在最新的cuda中被