2016-12-28 71 views
1

我有一個簡單的CUDA代碼,我翻譯成OpenACC。我的所有內核都按預期進行了並行處理,並且它們與我的CUDA內核具有相似的性能。但是,設備到主機的內存傳輸殺死了我的性能。在我的CUDA代碼中,我使用固定內存,性能更好。不幸的是,在OpenACC中,我不知道如何利用固定內存。我在文檔中找不到任何東西。有人能給我提供一個簡單的OpenACC示例,它使用固定內存嗎?OpenACC中的固定內存(使用PGI編譯器)

PS:我使用PGI 16.10-0 64位編譯

回答

3

使用「固定」子選項的「特斯拉」的目標,「-TA =特斯拉:釘」。請注意,您可以通過「-help -ta」標誌查看所有可用的子選項。

+0

非常感謝!有用!你是最棒的! – AstrOne