gpu-programming

    2熱度

    3回答

    我需要將標量值映射到範圍爲0到1的顏色。它將從綠色變爲紅色(從0到1)使用紋理座標進行線性插值(範圍從0到1) 我是新的OpenGL和GLSL,到目前爲止,我想通了,我需要寫在 gl_FragColor 是尺寸4的向量我不知道我怎麼能計算出R色值, G和B通道的gl_FragColor只是一個範圍爲0到1.0的標量值(它將從綠色變爲紅色並且在0.5它將變爲白色)

    -2熱度

    1回答

    目前由於某種原因,cudaMalloc將errno設置爲17,儘管返回了cudaSuccess。我一直在搜索互聯網,但我的google foo沒有給我帶來任何啓發,所以我決定詢問堆棧溢出的人。 這裏是我的輸出 ERROR: What is not going down, ERRSTR: Success, ERRNO 0 ERROR: What is going on here?, ERRSTR:

    0熱度

    1回答

    我已經下載了NVENC SDK。 當我打開samples_vs2008.sln時 - 所有項目都加載到解決方案中,並且nvEncoder正在工作。 當我打開samples_vs2010.sln: 僅nvEncoder加載項目等3個項目(cudaDecodeD3D9,cudaDecodeGL,cudaEncode)加載失敗。 對於每個失敗的項目中,我得到這個錯誤: ... \ cudaDecodeD

    -1熱度

    2回答

    我是cuda編程的新手。我想執行Cholesky分解爲小矩陣;(8 * 8)。是有什麼算法使用CUBLAS批處理功能讓它 CUDA版本6.5 謝謝

    3熱度

    1回答

    我在寫一個自定義SSIS任務,作爲它的一個函數,它應該在數據庫連接上執行一個存儲過程。我似乎無法找到有關如何完成的任何信息。 我正在使用ADO.NET連接管理器連接到數據庫,我希望在C#中編寫我的任務。 在自定義SSIS任務中執行SQL的首選方式是什麼?

    0熱度

    1回答

    我打算以並行方式計算大量的數字正方形,在一天結束時使用所有計算的常見數據集(一個相當大的數組的根和體重約25Kb的記憶)。 Gauss-Legendre積分方法非常簡單。我想通過聲明device double * d_droot,* d_dweight使設備中的所有線程,根和權重可用。但我錯過了一些東西,因爲我必須明確地傳遞指向數組的指針才能使內核正常工作。我如何正確地做到這一點?更重要的是,爲了

    1熱度

    1回答

    有沒有人知道代碼流如何在SLURM中分配GPU? 我已經經歷了,發現CUDA_VISIBLE_DEVICES環境變量沒有更新任何代碼。那麼在代碼中它是如何實際完成的呢? 我的目標是添加新的硬件支持使用環境變量進行分配。

    0熱度

    1回答

    爲整數分配內存我想在2個2D陣列,1個維數組和2點的整數cudaMlloc(),這樣我可以在我的內核用它來傳遞時得到錯誤。二維數組是雙精度的,其他是int。而1d數組包含浮點數。我不斷收到錯誤「沒有重載函數CudaMalloc的實例相匹配的參數list.argument類型有:(INT,INT)。我不知道我在做什麼錯 內核和我用它的方式是如下: __global__ void getMatrix(

    2熱度

    1回答

    我需要一個關於如何優化我的CUDA中Needleman-Wunsch算法實現的建議。 我想優化我的代碼以填充CUDA中的DP矩陣。由於矩陣元素之間的數據依賴性(每個下一個元素都依賴於其他元素 - 留給它,直到它,剩下它),我按如下方式並行填充反對角矩陣元素: __global__ void alignment_kernel(int *T, char *A, char *B, int t_M, in

    1熱度

    1回答

    我是cuda編程的新手。我正在開發Kepler GPU,它有 3.2 compute_capability 1024 max_threads_per_block 1 Multiprocessor 2048 max._threads per_Multiprocessor 2147483647 grid size 這是否意味着我只能爲內核分配2048?那麼如何處理這個大網格? 我的應用程序