我隨意閱讀了intel體系結構參考手冊http://www.cs.princeton.edu/courses/archive/spr12/cos217/reading/ia32opt.pdf,並且當我在閱讀指令延遲和吞吐量附錄時,發現延遲(時鐘週期數執行核心需要 完成構成指令的所有μops的執行)。sqrt指令的執行與除法(第C-28頁)指令的延遲完全相同 - 至少對於某些微體系結構。數字分別爲30,40和44個時鐘週期,分別爲單精度,雙精度和擴展精度。sqrt和div指令以相同速度運行
我的問題是sqrt指令怎麼能像div指令一樣大的處理器匯?我一直認爲sqrt指令在任何語言中都是昂貴的。
他們可能在某處使用查找表 – James 2013-02-16 05:05:48
也許,儘管我不相信將64位值的地址硬編碼到處理器中會使可管理的查找表 – 2013-02-16 05:12:01