opencl

    0熱度

    2回答

    我有一個需要在CPU上通過矩陣進行轉換的向量列表。我將它們存儲爲一個動態分配的數組(Eigen :: Vector4f *)。一旦它們被轉換,我需要在向量上運行OpenCL內核。我想知道什麼最好的方法是將這些數據傳遞到OpenCL,而不必從Eigen :: Vector - > float數組複製數據,因爲這樣做會相當昂貴。我的理解是,Eigen將矢量值存儲在某種可以訪問的緩衝區中?

    2熱度

    2回答

    可以說我有一個雖然有支持能力的設備,但目前不支持OpenCL。我有ISA,硬件設計文檔和許多其他文檔。我設備所在的系統目前擁有C和C++編譯器,並且支持許多Linux發行版。 現在我想添加OpenCL(可以說最新版本2.2)支持到我的設備。爲了讓我的設備得到支持,我實際上需要做些什麼?我在他們的網站上看到SPIR-V的文件,即:SPIR-V registry page,opencl extende

    0熱度

    2回答

    我將改進OCL內核性能,並且想要闡明內存事務如何工作以及哪種內存訪問模式真的更好(以及爲什麼)。 內核提供了8個整數的向量,這些整數被定義爲數組:int v [8],這意味着,在進行任何計算之前,必須將整個向量加載到GPR中。所以,我相信這個代碼的瓶頸是初始數據加載。 首先,我考慮一些理論基礎知識。 目標硬件是Radeon RX 480/580,具有256位GDDR5存儲器總線,突發讀/寫事務有8

    1熱度

    1回答

    OpenCL最佳實踐指南(https://www.cs.cmu.edu/afs/cs/academic/class/15668-s11/www/cuda-doc/OpenCL_Best_Practices_Guide.pdf)在3.1.3節中建議使用clFlush以確保命令以正確的順序發生,例如,處理不數據傳輸之前發生: 傳輸的數據隊列0 clFlush的隊列0 運行內核隊列0,傳輸數據的隊列1

    0熱度

    1回答

    我試圖將一段OpenCL內核代碼移植到SideFX Houdini,使用其內部腳本語言調用VEX(代表vector expression)使用 。 但是,我有理解這些索引做什麼和他們如何工作的問題。 據我所知,get_global_id()返回索引到一個給定的工作項目的工作(讀它的地方),但我真的不明白到底是什麼。 (也許與計算機核心有關,我猜?) 如果輸入是由x和y中的500像素形成的2D網格,

    0熱度

    1回答

    關於arm-cortexA53船舶信息:https://www.arm.com/products/processors/cortex-a; 關於opencl2.2信息:https://www.khronos.org/opencl/ I have huawei nova young really phone, cpu is Arm-cortexA53.Now i want to do some OP

    2熱度

    1回答

    我創建一個OpenFX插件的虛擬現實系統做一些圖像處理創建從cl_context OpenCL上下文。 由於我們現有的加工代碼,插件是爲主機,基於OpenCL的,主機開發商給了我一個擴展,OFX共享OpenCL的環境。 但是 - 我們的代碼使用C++ API(CL ::上下文),以及他們所提供的擴展給了我一個指針是C cl_context。 有沒有辦法爲我創造一個CL ::上下文從cl_conte

    0熱度

    1回答

    下面的代碼草稿我公司生產的: void __kernel myKernel(__global const short* input, __global short* output, const int width, const int height){ // Always square. (and 16x16 i

    1熱度

    1回答

    我真的是OpenCL的新手。我已經從這個網站獲取了示例代碼:http://www.drdobbs.com/open-source/easy-opencl-with-python/240162614?pgno=2,我已經對它進行了一些定製。我的目標是向內核發送一個填充1個數字的4x4矩陣,並從內核恢復它。我知道這是一個微不足道的代碼,但我需要這樣做來了解OpenCL的工作原理。輸入矩陣是這一個: [

    0熱度

    1回答

    我目前正在學習如何使用OpenCL進行編碼,並決定運行一些示例代碼。我已下載英特爾SDK,Microsoft Visual Studio 2017及其相關插件。 當我嘗試運行某個程序時,出現了與從Intel下載的%iNTELOCLSDKROOT依賴項中包含的其中一個「附加依賴性」文件有關的問題。我嘗試構建解決方案時遇到的錯誤是模板不能聲明爲具有C鏈接(C2894)。這個錯誤完全位於一個名爲xtr1