2013-03-18 82 views

回答

1

不知道如果你使用的是Windows或Linux,但是你有用於MS Visual Studio的Parallel Nsight(還有一個用於eclipse的版本)的windows。 Nsight可以讓你定義許多不同的「實驗」。即使你可以使用「自定義」實驗。如果您選擇「內存」實驗,它將包含所需的L1和L2高速緩存命中率。我附上截圖顯示Parallel Nsight Performance screenshot

這是取自NSight paralell 3.0,但它也可用於以前的版本。

編輯:

使用視覺分析器(版本至少爲5.0,但我想以前的版本將是相似的),你可以設置你是什麼樣的事件和指標興趣上,在Visual探查5.0,你可以打運行 - - >配置度量和事件。在附加窗口中,您可以設置任何要觀看的計數器。可用的度量和事件將取決於底層硬件(即GPU具有的可訪問的計數器)。在我的GTX附加圖片的一些存儲櫃480 Cache Events GTX 480 visual profiler 5.0

EDITED 2: 好只注意到你正在編輯原來的問題後,要求對Linux ...所以對Linux我不知道,如果nVidia提供了這樣的一個Visual Profiler(我猜他們會這樣做)。如果沒有,您可能會對Eclipse NSight版本感興趣...

+0

謝謝您的回答。我提出了它並更新了我的問題。 – dalibocai 2013-03-19 17:23:18