1
如何啓用CUDA中的命令行仿形「uncached_global_load_transaction」計數器分析如何剖析cuda內核全局內存事務的數量?
如何啓用CUDA中的命令行仿形「uncached_global_load_transaction」計數器分析如何剖析cuda內核全局內存事務的數量?
命令行分析器是使用以下環境變量來控制 -
COMPUTE_PROFILE: is set to either 1 or 0 (or unset) to enable or disable profiling.
COMPUTE_PROFILE_CONFIG: is used to specify a config file for enabling performance counters in the GPU and various other options.
COMPUTE_PROFILE_LOG: is set to the desired file path for profiling output.
你的情況,你可以設置上述環境變量作爲 -
COMPUTE_PROFILE=1
COMPUTE_PROFILE_CONFIG=config.txt
COMPUTE_PROFILE_LOG=profiler_output.txt
config.txt
必須包含一個條目uncached_global_load_transaction
。
謝謝。我做了同樣的事情,但分析器無法識別uncached_global_load_transaction選項。也許我的卡不支持它。 – dalibocai 2012-03-25 14:07:14