gpu

    1熱度

    1回答

    尋找在Objective-C或Carbon中檢索GPU模型的最有效方法。我想避免使用system_profiler,因爲它很慢,但如果它歸結爲我願意使用它,但我想先用盡其他選項。

    7熱度

    1回答

    要排序的數組大約有一百萬個字符串,其中每個字符串的長度可以高達一百萬個字符。 我正在尋找GPU的排序算法的任何實現。 我有一塊大小約爲1MB的數據,我需要構建suffix array。現在你可以看到如何在真正少量的內存中有一百萬個字符串。

    2熱度

    3回答

    我試圖將4800x9600矩陣的行添加到一起,導致矩陣1x9600。 我所做的是將4800x9600分成長度爲4800的9,600個矩陣。然後我對4800個元素進行縮減。 麻煩的是,這是很慢... 任何人有什麼建議嗎? 基本上,我試圖實現MATLAB的sum(...)函數。 這裏是我已經驗證的代碼工作正常,這只是它真的很慢: void reduceRows(Matrix Dresult,Matri

    2熱度

    2回答

    我看是在談論與iOS的多任務來個什麼東西剛纔提到一個有趣WWDC video(會話105): 「任何GPU的使用,同時您的應用程序是在 無論後臺的規定 結果自動終止 該應用程序,包括任何對OpenGL的調用。「 如果整個應用程序都是基於OpenGL的,如何處理這個「需求」? 注:我問this question,因爲我的基於OpenGL的應用程序似乎在模擬器中執行了多任務處理,但在設備上卻沒有(iP

    29熱度

    4回答

    是否可以在Java中進行GPU編程? 我的意思是沒有使用本地庫。 當我們切換到GPU的性能改進可以預期多少? 編輯: 我不看遊戲編程,我想要做的硬核數字運算。

    0熱度

    2回答

    我有一個字符指針數組,我想要發送到設備。有人能告訴我如何? 這裏是我到目前爲止已經試過: char **a; char **b; *a[0]="Foo1"; *a[1]=="Foo2"; cudaMalloc(void**)?,sizeof(?); cudamemcpy(b,a,sizeof(?),cudaMemcpyHostToDevice); 如何傳遞的參數上面兩個功能呢? 最

    3熱度

    1回答

    在Direct2D中,他們建議一起繪製類似的東西,以避免不必要的GPU狀態更改。他們還爲此做了一些重新排序的繪圖操作。 我必須繪製很多可以有兩種顏色之一的矩形。我正在考慮以兩遍進行繪圖,一次是用第一種顏色的矩形,另一種用於另一種顏色的矩形。 你知道這是否會提高渲染速度嗎?我現在的速度並不是那麼好。我繪製了從DrawingVisual獲得的DrawingContext。

    1熱度

    1回答

    我有一個NVIDIA的GeForce 8400GS顯卡,它有一個DVI輸出,我想要一個視頻或一系列的幀,並將它們顯示爲WUXGA(1920×1200)@ 120的DVI輸出赫茲與GTF(2×154兆赫),這是根據維基百科文章的DVI可能的顯示模式。我想這樣做是因爲我想要一個高於視頻文件的高幀率顯示。 你可以給我一些資源,我可以學習如何以這種方式控制DVI輸出嗎?否則,你可以給我其他想法來實現顯示器

    9熱度

    3回答

    您好:全局工作大小(維度)需要在OpenCL中工作組大小(維度)的多個? 如果是這樣,是否有處理矩陣的標準方式而不是多個工作組維度?我可以考慮兩種可能性: 動態地將工作組維度的大小設置爲全局工作維度的一個因子。 (這會招致尋找因素的開銷,並可能將工作組設置爲非最佳大小)。 將全局工作的維度增加到工作組維度的最接近的倍數,保留所有輸入和輸出緩衝區相同,但檢查內核中的邊界以避免出現段錯誤,即對所需輸出

    8熱度

    2回答

    隨時糾正我,如果我的理解的任何部分是錯誤的。 我的理解是,GPU提供了正常CPU提供的指令子集,但執行速度要快得多。 我知道有一些方法可以將GPU循環用於非圖形目的,但它看起來像(理論上)Just In Time編譯的語言可以檢測到合適的GPU的存在並將一些工作卸載到GPU後臺無需更改代碼。 我的理解是否天真?這只是一個非常複雜的問題,而且還沒有完成呢?