我使用了一個以前版本的Nvidia profiler來分析l1和l2緩存命中率,但我不確定我使用了哪個版本。看起來cuda 4.2可視化剖析器沒有L1和L2剖析信息(全局緩存重播開銷除外)。如何使用cuda 4.2(或特定的以前版本)可視化/命令行分析器來剖析L1或L2緩存命中率?如何在Linux上使用cuda 4.2 profiler在GTX480上分析L1和L2緩存命中率?
1
A
回答
1
不知道如果你使用的是Windows或Linux,但是你有用於MS Visual Studio的Parallel Nsight(還有一個用於eclipse的版本)的windows。 Nsight可以讓你定義許多不同的「實驗」。即使你可以使用「自定義」實驗。如果您選擇「內存」實驗,它將包含所需的L1和L2高速緩存命中率。我附上截圖顯示
這是取自NSight paralell 3.0,但它也可用於以前的版本。
編輯:
使用視覺分析器(版本至少爲5.0,但我想以前的版本將是相似的),你可以設置你是什麼樣的事件和指標興趣上,在Visual探查5.0,你可以打運行 - - >配置度量和事件。在附加窗口中,您可以設置任何要觀看的計數器。可用的度量和事件將取決於底層硬件(即GPU具有的可訪問的計數器)。在我的GTX附加圖片的一些存儲櫃480
EDITED 2: 好只注意到你正在編輯原來的問題後,要求對Linux ...所以對Linux我不知道,如果nVidia提供了這樣的一個Visual Profiler(我猜他們會這樣做)。如果沒有,您可能會對Eclipse NSight版本感興趣...
相關問題
- 1. CUDA編程 - L1和L2高速緩存
- 2. 如何查找L1和L2緩存?
- 3. 查找緩存L1和L2帶寬
- 4. 如何看到L1緩存未命中/命中python分析?
- 5. l1緩存和l2緩存有什麼區別?
- 6. 測量L1和L2高速緩存的大小和順序
- 7. 正規語言,L1和L2
- 8. 如何控制分配的內存是否存儲在L1,L2,L3緩存或其他JavaScript中?
- 9. 在PyTorch中添加L1/L2正則化?
- 10. 如何在Linux上使用Vtune Analyzer API
- 11. 如何在MACOSX上使用GLUT和CUDA?
- 12. 的Cortex A53 L1 L2高速緩存信息
- 13. 如何在Linux上不使用CUDA使用TensorFlow?
- 14. L1和L2目錄的魷魚數
- 15. JDO L2緩存SingleFieldIdentity
- 16. 能源模型()中的l1和l2在ns2中的含義
- 17. 用perf和papi測量L1數據緩存未命中
- 18. Delphi Profiler和內存分析工具
- 19. GPU中共享內存和L1緩存有什麼區別?
- 20. 在Linux服務器上運行的CUDA程序的遠程調試和分析
- 21. L1高速緩存命中與x86上寄存器的週期/成本?
- 22. 使用Hibernate作爲ORM機制的Web應用程序中的L1和L2緩存之間有什麼區別?
- 23. 高效的緩存和BLOB的 - 分析緩存命中/未命中
- 24. 如何衡量HTTP緩存命中率?
- 25. 提高緩存命中率
- 26. 如何在使用createJS和Flash CC的Movieclip上使用緩存
- 27. 如何在C++中快速計算矢量的歸一化l1和l2範數?
- 28. 使用memcached進行Hibernate L2緩存
- 29. 如何在Linux上獲得整體CPU使用率(例如57%)
- 30. 在Linux上刷新數據緩存
謝謝您的回答。我提出了它並更新了我的問題。 – dalibocai 2013-03-19 17:23:18