amd-processor

    6熱度

    1回答

    我正在評估OpenCL for AMD和Nvidia GPU之間的性能差異。我有一個執行矩陣向量乘法的內核。我現在在兩個不同的系統上運行內核,我的筆記本電腦有一個帶有Ubuntu 12.04和CUDA 4.0(包含OpenCL庫和標頭)的NVidia GT525m,另一個是帶有AMD Radeon HD7970的臺式機,帶有Ubuntu 12.04和最新的Catalyst驅動程序。 在內核中,我有

    1熱度

    1回答

    在我的電腦與Windows 7操作系統我有這個廠商的OpenCL的SDK的三個版本: 英特爾 NVIDIA AMD。 我建立我的應用程序與他們每個人。 作爲輸出我有三個不同的二進制文件。 例如:my_app_intel_x86,my_app_amd_x86,my_app_nvidia_x86 這個二進制文件在此不同: 他們使用不同的SDK在likange過程 他們試圖在運行時 找到不同的OpenC

    2熱度

    1回答

    我是一個OpenCL的新手,我想開始學習如何編寫能夠在我的視頻卡上運行的程序(AMD Radeon 6970)。我已經安裝了AMD的應用SDK,這是我需要開始的嗎? 我試圖建立他們納入樣本的解決方案,但我得到: 錯誤C1083:無法打開包含文件:「d3dx10.h」:沒有這樣的文件或目錄C:\用戶\ ... \ simpledx10 \ SimpleDX10.hpp 我認爲這是因爲我安裝了DX11

    0熱度

    1回答

    並行代碼(openmp),在intel上編譯和intel(linux)上使用gcc,在intel計算機上運行速度要快於具有兩倍多核心的AMD。我看到所有內核都在使用中,但它在AMD上花費了大約10倍的CPU時間。我曾經在intel編譯器中聽說過「癱瘓AMD」,但我正在使用gcc!在此先感謝

    0熱度

    3回答

    我有下一個問題: 我有一些與xop檢查相關的測試,使用一些Bulldozer (xop)說明。 而且我只能在Bulldozer處理器上運行這個測試。 如何在編譯時檢查我的處理器是否支持xop指令? 語言:C,鋨:Linux;

    1熱度

    1回答

    下面的內核計算聲壓場,每個線程計算它自己的pressure向量的私有實例,然後需要將其總結爲全局內存。 我很確定計算pressure向量的代碼是正確的,但我仍然無法使這產生預期的結果。 int gid = get_global_id(0); int lid = get_local_id(0); int nGroups = get_num_groups(0); int groupSize

    9熱度

    2回答

    我有一個應用程序,我想在多個進程之間共享一個GPU。也就是說,這些進程中的每一個都會創建自己的CUDA或OpenCL上下文,並以相同的GPU爲目標。根據Fermi白皮書[1],應用級上下文切換時間小於25微秒,但啓動會在GPU上啓動時有效地進行序列化 - 所以費米在此方面效果不佳。根據開普勒白皮書[2],有一種叫做Hyper-Q的技術,允許來自多個CUDA流,MPI進程或進程內的線程的多達32個同

    3熱度

    2回答

    我正在用Java編寫程序 在這個程序中,我正在讀取和更改一組數據。這是代碼的一個例子: public double computation() { char c = 0; char target = 'a'; int x = 0, y = 1; for (int i = 0; i < data.length; i++) { // Read Da

    1熱度

    2回答

    我試圖找出一種方法來執行OpenCL內核的離線編譯而不安裝圖形卡。我已經安裝了SDK。 有沒有人在編譯OpenCL內核方面沒有爲NVIDIA或AMD中的任何一個安裝顯卡的經驗。 I had asked a similar question on AMD forums (http://devgurus.amd.com/message/1284379). NVIDIA forums for lon

    2熱度

    1回答

    我一直有一個錯位結構的麻煩。這裏所涉及的結構: struct Ray { float4 origin; float4 dir; float len; float dummy [3]; }; struct RayStack { struct Ray r [STACK_DEPTH]; int depth [STACK_DEPTH];