amd-processor

6熱度

1回答

我正在評估OpenCL for AMD和Nvidia GPU之間的性能差異。我有一個執行矩陣向量乘法的內核。我現在在兩個不同的系統上運行內核，我的筆記本電腦有一個帶有Ubuntu 12.04和CUDA 4.0（包含OpenCL庫和標頭）的NVidia GT525m，另一個是帶有AMD Radeon HD7970的臺式機，帶有Ubuntu 12.04和最新的Catalyst驅動程序。在內核中，我有

1熱度

1回答

許多OpenCL SDK的。我應該選擇哪一個？

在我的電腦與Windows 7操作系統我有這個廠商的OpenCL的SDK的三個版本：英特爾 NVIDIA AMD。我建立我的應用程序與他們每個人。作爲輸出我有三個不同的二進制文件。例如：my_app_intel_x86，my_app_amd_x86，my_app_nvidia_x86 這個二進制文件在此不同：他們使用不同的SDK在likange過程他們試圖在運行時找到不同的OpenC

2熱度

1回答

Windows 7上的OpenCL，AMD Radeon，Visual Studio 2010 - 如何開始？

我是一個OpenCL的新手，我想開始學習如何編寫能夠在我的視頻卡上運行的程序（AMD Radeon 6970）。我已經安裝了AMD的應用SDK，這是我需要開始的嗎？我試圖建立他們納入樣本的解決方案，但我得到：錯誤C1083：無法打開包含文件：「d3dx10.h」：沒有這樣的文件或目錄C：\用戶\ ... \ simpledx10 \ SimpleDX10.hpp 我認爲這是因爲我安裝了DX11

0熱度

1回答

在多核AMD上並行代碼較慢

並行代碼（openmp），在intel上編譯和intel（linux）上使用gcc，在intel計算機上運行速度要快於具有兩倍多核心的AMD。我看到所有內核都在使用中，但它在AMD上花費了大約10倍的CPU時間。我曾經在intel編譯器中聽說過「癱瘓AMD」，但我正在使用gcc！在此先感謝

0熱度

3回答

AMD xop支持

我有下一個問題：我有一些與xop檢查相關的測試，使用一些Bulldozer (xop)說明。而且我只能在Bulldozer處理器上運行這個測試。如何在編譯時檢查我的處理器是否支持xop指令？語言：C，鋨：Linux;

1熱度

1回答

OpenCL從私有到局部還是全局？

下面的內核計算聲壓場，每個線程計算它自己的pressure向量的私有實例，然後需要將其總結爲全局內存。我很確定計算pressure向量的代碼是正確的，但我仍然無法使這產生預期的結果。 int gid = get_global_id(0); int lid = get_local_id(0); int nGroups = get_num_groups(0); int groupSize

9熱度

2回答

來自多個進程的並行GPU內核執行

我有一個應用程序，我想在多個進程之間共享一個GPU。也就是說，這些進程中的每一個都會創建自己的CUDA或OpenCL上下文，並以相同的GPU爲目標。根據Fermi白皮書[1]，應用級上下文切換時間小於25微秒，但啓動會在GPU上啓動時有效地進行序列化 - 所以費米在此方面效果不佳。根據開普勒白皮書[2]，有一種叫做Hyper-Q的技術，允許來自多個CUDA流，MPI進程或進程內的線程的多達32個同

3熱度

2回答

如何通過Java收集AMD CPU高速緩存命中率？

我正在用Java編寫程序在這個程序中，我正在讀取和更改一組數據。這是代碼的一個例子： public double computation() { char c = 0; char target = 'a'; int x = 0, y = 1; for (int i = 0; i < data.length; i++) { // Read Da

1熱度

2回答

離線編譯沒有安裝卡的AMD和NVIDIA OpenCL Kernel

我試圖找出一種方法來執行OpenCL內核的離線編譯而不安裝圖形卡。我已經安裝了SDK。有沒有人在編譯OpenCL內核方面沒有爲NVIDIA或AMD中的任何一個安裝顯卡的經驗。 I had asked a similar question on AMD forums (http://devgurus.amd.com/message/1284379). NVIDIA forums for lon

2熱度

1回答

ATI/AMD OpenCL的局部變量對齊

我一直有一個錯位結構的麻煩。這裏所涉及的結構： struct Ray { float4 origin; float4 dir; float len; float dummy [3]; }; struct RayStack { struct Ray r [STACK_DEPTH]; int depth [STACK_DEPTH];