我有一些內存已分配在設備上,它只是一個大小爲H * W * sizeof(float)的單一malloc。cudaMemcpy2D共享內存拷貝
這是表示H * W矩陣。
我有一個代碼,我需要交換矩陣的象限。我可以使用cudaMemcpy2D來完成此操作嗎?我是否需要將spitch和dpitch指定爲W * sizeof(float),並僅使用指向矩陣每個象限的指針來完成此操作?
此外,當這些cudaMemcpy談論的內存區域不重疊 - 是否意味着src和dst根本不能重疊?如果我有一個10字節寬的陣列,我想向左移一次 - 它會失敗嗎?
由於