2015-09-07 78 views

回答

2

編輯:爲了正確回答問題:是的,它是正確的方式,在CL 2.0或更早版本中沒有其他方式。


的CL編碼生成的彙編(並且因此,慢步驟)是 「方案」 創建(clProgramBuild + clProgramLink)。

當你創建一個內核。你只是創建包了對象:

  • 的入口點函數的程序代碼
  • 參數輸入+輸出到功能
  • 有些記憶記住調用
  • 之間的所有上述數據

這是一個簡單的任務,應該幾乎是免費的。

這就是爲什麼最好有多個內核具有不同的輸入參數。而不是一個單一的內核,並改變每個循環的參數。

+0

但是,我必須做一遍又一遍地查找多個內核的名字嗎? – BlueWanderer

+0

與彙編相比,名稱查找應該便宜。無論如何,創作只發生在CL節目的開始。這完全取決於您生成多少內核以及多少次。 BUt通常應該是所有鏈條中最便宜的部分。 – DarkZeros

+0

猜猜這裏沒有更好的解決方案。這可以完成這項工作,但很腥。也許這不是很麻煩,但也可以很容易避免。複製似乎明顯比從頭創建一個新的更便宜... – BlueWanderer

相關問題