2010-10-02 53 views

回答

4

爲了獲得最快的速度,你必須編寫使用NEON SIMD操作的ARM彙編語言代碼,因爲C編譯器通常不會編譯非常好的SIMD代碼,所以手寫彙編將會產生很大的差異。我有一個簡短的介紹在這裏:http://www.shervinemami.co.cc/iphoneAssembly.html

注意的是,iPad的A4採用的ARMv7-A的CPU,因此對於NEON SIMD指令的參考手冊在:http://infocenter.arm.com/help/topic/com.arm.doc.ddi0406b/index.html (但其2000頁長,需要組裝的理解代碼,也許一般SIMD!)。

5

指令集NEON,intrinsics reference

我從來沒有能夠找到什麼他們都其實都是很好的文檔。但是如果你已經接觸到了SSE,你很快就會發現它。

+0

呃,而上證所是...? – dugla 2010-10-03 11:47:05

+1

SSE是針對x86的SIMD,您嘗試使用什麼代碼進行矢量化? – 2010-10-03 15:07:25

+0

這是一個圖像處理應用程序。我需要將通常使用LUT完成的窗口級操作轉換爲SIMD操作。我需要儘可能快地觸摸屏幕上的每個像素。使用GPU + GLSL使事情變得複雜。 – dugla 2010-10-04 01:05:32