TensorFlow CPU和CUDA代碼共享

2017-08-04 128 views 1 likes

我正在爲共享自定義功能代碼的TensorFlow編寫C++和CUDA操作系統。通常在CPU和CUDA實現之間共享代碼時，如果編譯CUDA，則會定義一個宏來將__device__說明符插入到函數簽名中。在TensorFlow中是否有以這種方式共享代碼的內置方式？TensorFlow CPU和CUDA代碼共享

如何定義可以在CPU和GPU上運行的實用函數（通常是內聯）？

來源

2017-08-04 Jack H

回答

事實證明，在TensorFlow中的下列宏將做我所描述的。

namespace tensorflow{ 
    EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE 
    void foo() { 
     // 
    } 
}

來源

2017-08-16 14:07:51

相關問題

1. 我如何使這個代碼cuda（cpu代碼到cuda代碼）
2. 在CPU和GPU-CUDA之間共享變量
3. 代碼共享
4. CUDA，在共享memroy
5. CUDA共享內存
6. Tensorflow僅在CPU上運行CUDA版本
7. ASP.NET - 共享代碼
8. 共享JavaScript代碼
9. PHP共享代碼
10. Tensorflow和CUDA版本
11. Tensorflow 1.3和CUDA 8.1
12. CUDA共享內存佔用
13. CUDA：共享內存分配
14. cuda共享內存覆蓋？
15. RIA服務比。 WCF和共享代碼
16. Git - 分支和共享代碼庫
17. 在AddViewController和DetailViewController之間共享代碼
18. 在NSDocument和UIDocument之間共享代碼
19. asmx和wcf之間的共享代碼
20. 在Flex和AIR之間共享代碼
21. C++常量過載和代碼共享
22. Tensorflow：在GPU和CPU
23. Tensorflow RNN細胞重共享
24. Tensorflow：共享可變張量
25. Tensorflow seq2seq權重共享
26. tensorflow多GPU共享變量
27. 通過APEX代碼共享
28. 兩個UIButtons共享代碼
29. 共享代碼佈局
30. php svn共享代碼庫