2011-02-02 90 views
2

不幸的是,基於費米的GPU將在並行Nsight中對任何內核時序進行跟蹤,即使它們是不同流中的併發內核。定時並行CUDA內核

任何人都可以提出如何使用定時器手動顯示內核在不同流中的併發性。

乾杯 埃德

回答

2

與Nsight剖析當前確實禁用並行內核,因此要獲得準確的計時,您需要使用事件追蹤時機。

您可以像預期的那樣使用事件,並且可以使用cudaStreamWaitEvent()使流等待另一個流中的事件。有關更多信息,請參見CUDA Reference Manual第4.5.2.5節。