2014-09-03 118 views
0

在特斯拉K20模型中,峯值單精度浮點性能約爲3.52 TFlops,但雙精度爲1.17 TFlops,因此比率爲3.特斯拉K20X有3.95和1.31,特斯拉K40有4.29和1.43 TFlops ,這個比例似乎重複。我的問題是,如果有一個原因的比例是3而不是2,這對我來說似乎是合乎邏輯的,因爲單精度和雙精度之間的差異。我正在學習GPUS和GPGPUS,所以我不太瞭解它。NVIDIA Tesla中單精度和雙精度之間是否存在關係?

在這個pdf的第二頁有一個規格表。 NVIDIA-Tesla-Kepler-Family-Datasheet.pdf

回答

0

您列出的型號全部基於開普勒架構,其峯值雙精度率等於峯值單精度率的1/3。這是NVIDIA製造這塊硬件的方式。爲了比較,作爲前一代硬件的費米,峯值雙精度和單精度率之間的比值爲1/2。

你可以參考NVIDIA文檔的指令吞吐量,按指令類型和硬件生成:

http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#maximize-instruction-throughput

你會發現,消費級產品(的GeForce GTX)通常具有低得多的雙TO-單精度速率 - 1/8,1/12,1/24,甚至1/32,具體取決於硬件版本。