2010-05-08 315 views
1

已經完成了我的應用程序,其乘以CRS矩陣和向量(SpMV),現在唯一要做的就是計算FLOPS我的應用程序。在我看來,在稀疏矩陣 - 向量乘法的情況下,估計浮點運算的數量是非常困難的,因爲一行乘法的數量實際上是「跳躍」或流暢。計算FLOPS/GFLOPS在程序中 - CUDA

我只嘗試使用「cudaprof」(可在./CUDA/bin目錄中)測量時間 - 它工作正常。

任何sugestions和說明貼讚賞!

回答

2

這不只是你的意見;簡單的事實是,稀疏矩陣情況下的操作數量是依賴於數據的,因此如果不瞭解數據,就無法得到合理的答案。這使得不可能有一個一勞永逸的數據估計。

這可能是您可以花費很多時間仔細考慮以及做出準確估計的情況之一,或者您可以花幾分鐘時間寫出您的變體每次執行操作時遞增計數器的現有實現。當然,這需要相當長的時間才能運行(特別是如果你不以CUDA啓用的形式進行),但可能花費的時間比完成思維所需的時間少得多,當答案出來時,你不需要做很多工作來說服自己是對的。