gpgpu

4熱度

2回答

我的工作廣泛使用Migliore，Martorana和Sciortino的算法來查找所有可能的簡單路徑，即沒有多次遇到任何節點的路徑，如圖所示：An Algorithm to find All Paths between Two Nodes in a Graph。（雖然這個算法本質上是一個深度優先的搜索，並且本質上是直觀遞歸的，但作者還提出了一個非遞歸的，基於堆棧的實現。）我想知道這樣的算法是否

5熱度

2回答

在iPhone上進行GPU加速計算（GPGPU）的資源？

我有興趣在iOS中進行GPU加速計算（適用於iPhones 3GS和4）。不幸的是，這兩款設備都不支持OpenCL，所以它似乎唯一的選擇是將程序數據表達爲圖形數據，並使用OpenGL ES 2.0可編程着色器（頂點和片段）來完成工作。任何人都可以推薦任何可能有用的資源？示例代碼是聖盃。

17熱度

6回答

如何創建或操縱GPU彙編程序？

有沒有人在創建/操作GPU機器代碼方面有經驗，可能在運行時？我有興趣修改GPU彙編代碼，可能在運行時以最小的開銷。具體而言，我對基於彙編的遺傳編程感興趣。據我所知，ATI已經發布了部分卡片的ISA，而nvidia最近針對舊卡片發佈了針對CUDA的反彙編程序，但我不確定是否可以在運行時甚至是手頭修改內存中的指令。這可能嗎？歡迎任何相關信息。

1熱度

2回答

Linux上的Nvidia信息泄露/內存漏洞和一般操作系統內存保護

我認爲這是預期的行爲？來源：http://classic.chem.msu.su/cgi-bin/ceilidh.exe/gran/gamess/forum/?C35e9ea936bHW-7675-1380-00.htm 意譯總結：「我們發現，cudaHostAlloc/cuMemHostAlloc CUDA API調用返回未初始化的固定內存的Linux的端口上的工作該洞可能會允許一個檢查以前使

6熱度

3回答

搞清楚cuda內核有多少塊和線程，以及如何使用它們

我一直在想如何讓我認爲是一個簡單的內核來取得2d矩陣中的值的平均值，但我有一些問題讓我的思維過程直接影響到它。根據我的設備查詢輸出，我的GPU有16MP，32cores/mp，最大塊是1024x1024×64，我有一個最大線程數/塊= 1024。所以，我正在處理一些大的圖像。也許5000px x 3500px或類似的東西。我的一個內核正在對圖像中所有像素取平均值。現有代碼將圖像存儲爲2D數組

5熱度

4回答

CUDA和MATLAB for循環優化

我將嘗試通過使用CUDA優化用MATLAB編寫的一些代碼。我最近開始編程CUDA，但我對它的工作原理有了一個總體的瞭解。所以，說我想添加兩個矩陣在一起。在CUDA中，我可以編寫一個算法，利用線程計算結果矩陣中每個元素的答案。但是，這種技術可能與MATLAB已經做的很相似嗎？在那種情況下，效率是否獨立於技術並且僅僅歸因於硬件水平？

1熱度

1回答

什麼流行的軟件利用通用GPU？

所以我聽說很多關於軟件開發轉向GPU ......但是有誰知道任何實際利用GPU上的計算的流行軟件？

2熱度

1回答

線程索引

我跑我的8000系列設備上的下面的代碼（支持CUDA）： #include <stdio.h> __global__ void testSet(int * MyBlock) { unsigned int ThreadIDX= threadIdx.x+blockDim.x*blockIdx.x; MyBlock[ThreadIDX]=ThreadIDX; } int m

5熱度

1回答

Android中使用NDK的OpenGL ES 2的一些教程？

具體而言，我需要使用底紋語言GLSL。我已經安裝了NDK，SDK和其他一切，並且運行正常，我使用NDK運行了openGLES 2的例子，它工作正常，問題是有很多指令我不會被忽略。所以我需要一個教程或書，教我一步一步

1熱度

3回答

混合音頻使用的OpenGL

我想用OpenGL的混合兩個（或更多）16位音頻流，我需要一點幫助基本上就是我想要做的是把音頻數據轉換成紋理，我提請一個幀緩衝區對象，然後回讀。這不是一個問題，但是提供正確結果的數據的方式會有點問題。我基本上有兩個問題。爲了通過繪圖混合數據我需要使用混合（alpha = 0.5），但是結果不應該有任何alpha通道。所以如果我渲染到例如格式爲RGB的幀緩衝區將會像我期望的那樣繼續工作，並且生