gpu

1熱度

1回答

GPU芯片組檢測

尋找在Objective-C或Carbon中檢索GPU模型的最有效方法。我想避免使用system_profiler，因爲它很慢，但如果它歸結爲我願意使用它，但我想先用盡其他選項。

7熱度

1回答

是否有算法來排序GPU的字符串數組？

要排序的數組大約有一百萬個字符串，其中每個字符串的長度可以高達一百萬個字符。我正在尋找GPU的排序算法的任何實現。我有一塊大小約爲1MB的數據，我需要構建suffix array。現在你可以看到如何在真正少量的內存中有一百萬個字符串。

2熱度

3回答

CUDA添加行矩陣

我試圖將4800x9600矩陣的行添加到一起，導致矩陣1x9600。我所做的是將4800x9600分成長度爲4800的9,600個矩陣。然後我對4800個元素進行縮減。麻煩的是，這是很慢... 任何人有什麼建議嗎？基本上，我試圖實現MATLAB的sum（...）函數。這裏是我已經驗證的代碼工作正常，這只是它真的很慢： void reduceRows(Matrix Dresult,Matri

2熱度

2回答

如何在iOS 4上處理基於OpenGL ES的應用程序的多任務處理？

我看是在談論與iOS的多任務來個什麼東西剛纔提到一個有趣WWDC video（會話105）：「任何GPU的使用，同時您的應用程序是在無論後臺的規定結果自動終止該應用程序，包括任何對OpenGL的調用。「如果整個應用程序都是基於OpenGL的，如何處理這個「需求」？注：我問this question，因爲我的基於OpenGL的應用程序似乎在模擬器中執行了多任務處理，但在設備上卻沒有（iP

29熱度

4回答

Java GPU編程

是否可以在Java中進行GPU編程？我的意思是沒有使用本地庫。當我們切換到GPU的性能改進可以預期多少？編輯：我不看遊戲編程，我想要做的硬核數字運算。

0熱度

2回答

將char **數據類型發送到設備

我有一個字符指針數組，我想要發送到設備。有人能告訴我如何？這裏是我到目前爲止已經試過： char **a; char **b; *a[0]="Foo1"; *a[1]=="Foo2"; cudaMalloc(void**)?,sizeof(?); cudamemcpy(b,a,sizeof(?),cudaMemcpyHostToDevice); 如何傳遞的參數上面兩個功能呢？最

3熱度

1回答

WPF高性能繪圖 - 我應該用刷子顏色分組嗎？

在Direct2D中，他們建議一起繪製類似的東西，以避免不必要的GPU狀態更改。他們還爲此做了一些重新排序的繪圖操作。我必須繪製很多可以有兩種顏色之一的矩形。我正在考慮以兩遍進行繪圖，一次是用第一種顏色的矩形，另一種用於另一種顏色的矩形。你知道這是否會提高渲染速度嗎？我現在的速度並不是那麼好。我繪製了從DrawingVisual獲得的DrawingContext。

1熱度

1回答

編程GPU控制DVI輸出

我有一個NVIDIA的GeForce 8400GS顯卡，它有一個DVI輸出，我想要一個視頻或一系列的幀，並將它們顯示爲WUXGA（1920×1200）@ 120的DVI輸出赫茲與GTF（2×154兆赫），這是根據維基百科文章的DVI可能的顯示模式。我想這樣做是因爲我想要一個高於視頻文件的高幀率顯示。你可以給我一些資源，我可以學習如何以這種方式控制DVI輸出嗎？否則，你可以給我其他想法來實現顯示器

9熱度

3回答

全球工作規模是否需要成爲OpenCL中工作組大小的倍數？

您好：全局工作大小（維度）需要在OpenCL中工作組大小（維度）的多個？如果是這樣，是否有處理矩陣的標準方式而不是多個工作組維度？我可以考慮兩種可能性：動態地將工作組維度的大小設置爲全局工作維度的一個因子。（這會招致尋找因素的開銷，並可能將工作組設置爲非最佳大小）。將全局工作的維度增加到工作組維度的最接近的倍數，保留所有輸入和輸出緩衝區相同，但檢查內核中的邊界以避免出現段錯誤，即對所需輸出

8熱度

2回答

JIT編譯器可以在後臺的某些操作中使用GPU嗎？

隨時糾正我，如果我的理解的任何部分是錯誤的。我的理解是，GPU提供了正常CPU提供的指令子集，但執行速度要快得多。我知道有一些方法可以將GPU循環用於非圖形目的，但它看起來像（理論上）Just In Time編譯的語言可以檢測到合適的GPU的存在並將一些工作卸載到GPU後臺無需更改代碼。我的理解是否天真？這只是一個非常複雜的問題，而且還沒有完成呢？