2017-02-23 161 views
0

我看到最近一個new commit被插入到Caffe中,它應該能夠使用Python接口/ Python自定義圖層進行多GPU培訓。 我似乎無法使用我的Python代碼中的多GPU來訓練網絡。 我克隆了更新後的版本庫,並使用USE_NCCL創建了Caffe。 命令我想在我的Python腳本使用方法:如何使用Caffe(pycaffe)在Python中使用多GPU訓練?

caffe.set_mode_gpu() 
caffe.set_solver_count(2) 

的錯誤,我得到:

F0223 10:27:41.249380 23468 python_layer.hpp:25] PythonLayer不 支持CLI多-GPU,請使用train.py

從命令行運行腳本時,它僅使用1個GPU。

+0

你可以通過caffe multi-gpu獲得訓練加速嗎? – nn0p

+0

是的,你可以獲得加速 – guyov

+0

你獲得了多少加速?我使用NCCL在AlexNet上進行了測試,使用2張卡實現了1.92加速,但使用4張卡時達到了1.72。沒有NCCL,它是1.40(2張牌)比1.33(4張牌)。 – nn0p

回答

2

我最近還嘗試了Python Caffe中的多GPU支持。你可能想這給讀: https://github.com/BVLC/caffe/blob/master/docs/multigpu.md

來自Caffe只支持命令行和次列車時,即你必須使用train.py文件(./build/tools/caffe列車)多GPU,並給您想用作此腳本參數的GPU。 它在我上面指出的文件中有很好的解釋。

我試着在我的python腳本中使用caffe.set_solver.count(2)。我沒有得到任何錯誤,但是我的模型只在一個GPU上訓練。

-Ayushi