NVIDIA Tesla中單精度和雙精度之間是否存在關係？

在特斯拉K20模型中，峯值單精度浮點性能約爲3.52 TFlops，但雙精度爲1.17 TFlops，因此比率爲3.特斯拉K20X有3.95和1.31，特斯拉K40有4.29和1.43 TFlops ，這個比例似乎重複。我的問題是，如果有一個原因的比例是3而不是2，這對我來說似乎是合乎邏輯的，因爲單精度和雙精度之間的差異。我正在學習GPUS和GPGPUS，所以我不太瞭解它。NVIDIA Tesla中單精度和雙精度之間是否存在關係？

在這個pdf的第二頁有一個規格表。 NVIDIA-Tesla-Kepler-Family-Datasheet.pdf

來源

2014-09-03 emmamm05

您列出的型號全部基於開普勒架構，其峯值雙精度率等於峯值單精度率的1/3。這是NVIDIA製造這塊硬件的方式。爲了比較，作爲前一代硬件的費米，峯值雙精度和單精度率之間的比值爲1/2。

你可以參考NVIDIA文檔的指令吞吐量，按指令類型和硬件生成：

http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#maximize-instruction-throughput

你會發現，消費級產品（的GeForce GTX）通常具有低得多的雙TO-單精度速率 - 1/8，1/12，1/24，甚至1/32，具體取決於硬件版本。

來源

2014-11-22 02:49:53

NVIDIA Tesla中單精度和雙精度之間是否存在關係？

回答

相關問題