gpgpu

    4熱度

    2回答

    我的工作廣泛使用Migliore,Martorana和Sciortino的算法來查找所有可能的簡單路徑,即沒有多次遇到任何節點的路徑,如圖所示:An Algorithm to find All Paths between Two Nodes in a Graph。 (雖然這個算法本質上是一個深度優先的搜索,並且本質上是直觀遞歸的,但作者還提出了一個非遞歸的,基於堆棧的實現。)我想知道這樣的算法是否

    5熱度

    2回答

    我有興趣在iOS中進行GPU加速計算(適用於iPhones 3GS和4)。不幸的是,這兩款設備都不支持OpenCL,所以它似乎唯一的選擇是將程序數據表達爲圖形數據,並使用OpenGL ES 2.0可編程着色器(頂點和片段)來完成工作。任何人都可以推薦任何可能有用的資源?示例代碼是聖盃。

    17熱度

    6回答

    有沒有人在創建/操作GPU機器代碼方面有經驗,可能在運行時? 我有興趣修改GPU彙編代碼,可能在運行時以最小的開銷。具體而言,我對基於彙編的遺傳編程感興趣。 據我所知,ATI已經發布了部分卡片的ISA,而nvidia最近針對舊卡片發佈了針對CUDA的反彙編程序,但我不確定是否可以在運行時甚至是手頭修改內存中的指令。 這可能嗎?歡迎任何相關信息。

    1熱度

    2回答

    我認爲這是預期的行爲? 來源:http://classic.chem.msu.su/cgi-bin/ceilidh.exe/gran/gamess/forum/?C35e9ea936bHW-7675-1380-00.htm 意譯總結:「我們發現,cudaHostAlloc/cuMemHostAlloc CUDA API調用返回未初始化的固定內存的Linux的端口上的工作該洞可能會允許一個檢查以前使

    6熱度

    3回答

    我一直在想如何讓我認爲是一個簡單的內核來取得2d矩陣中的值的平均值,但我有一些問題讓我的思維過程直接影響到它。 根據我的設備查詢輸出,我的GPU有16MP,32cores/mp,最大塊是1024x1024×64,我有一個最大線程數/塊= 1024。 所以,我正在處理一些大的圖像。也許5000px x 3500px或類似的東西。我的一個內核正在對圖像中所有像素取平均值。 現有代碼將圖像存儲爲2D數組

    5熱度

    4回答

    我將嘗試通過使用CUDA優化用MATLAB編寫的一些代碼。我最近開始編程CUDA,但我對它的工作原理有了一個總體的瞭解。 所以,說我想添加兩個矩陣在一起。在CUDA中,我可以編寫一個算法,利用線程計算結果矩陣中每個元素的答案。但是,這種技術可能與MATLAB已經做的很相似嗎?在那種情況下,效率是否獨立於技術並且僅僅歸因於硬件水平?

    1熱度

    1回答

    所以我聽說很多關於軟件開發轉向GPU ......但是有誰知道任何實際利用GPU上的計算的流行軟件?

    2熱度

    1回答

    我跑我的8000系列設備上的下面的代碼(支持CUDA): #include <stdio.h> __global__ void testSet(int * MyBlock) { unsigned int ThreadIDX= threadIdx.x+blockDim.x*blockIdx.x; MyBlock[ThreadIDX]=ThreadIDX; } int m

    5熱度

    1回答

    具體而言,我需要使用底紋語言GLSL。我已經安裝了NDK,SDK和其他一切,並且運行正常,我使用NDK運行了openGLES 2的例子,它工作正常,問題是有很多指令我不會被忽略。所以我需要一個教程或書,教我一步一步

    1熱度

    3回答

    我想用OpenGL的混合兩個(或更多)16位音頻流,我需要一點幫助 基本上就是我想要做的是把音頻數據轉換成紋理,我提請一個幀緩衝區對象,然後回讀。這不是一個問題,但是提供正確結果的數據的方式會有點問題。 我基本上有兩個問題。 爲了通過繪圖混合數據我需要使用混合(alpha = 0.5),但是結果不應該有任何alpha通道。所以如果我渲染到例如格式爲RGB的幀緩衝區將會像我期望的那樣繼續工作,並且生