1
我正在從源代碼編譯當前主版本。如果我編譯使用CUDA 7.5和CUDNN 4.0我碰到下面的編譯錯誤:Tensorflow:RC 0.10 3X慢於0.9
ERROR: /home/rob/tensorflow/tensorflow/contrib/rnn/BUILD:45:1: undeclared inclusion(s) in rule '//tensorflow/contrib/rnn:python/ops/_lstm_ops_gpu':
this rule is missing dependency declarations for the following files included by 'tensorflow/contrib/rnn/kernels/lstm_ops_gpu.cu.cc':
'/usr/local/cuda-7.5/include/cuda_runtime.h'
'/usr/local/cuda-7.5/include/host_config.h'
'/usr/local/cuda-7.5/include/builtin_types.h'
[etc...]
如果我和CUDNN 5.1編譯,一切都可以編譯和運行,但執行時間大約是3倍更長的時間我目前運行的培訓講稿與使用通過pip安裝的0.9.0版本相同。
我也試過的0.10.rc0(GPU)的PIP版本,並看到了同樣的3X減緩與0.9.0版本
我使用Ubuntu 14.04,PY 3.4和特斯拉K40c GPU。 Bazel是0.3.1版本
3X速度減慢0.10.0rc0版本的原因是什麼,並且有什麼方法可以重新獲得先前的性能嗎?
其次,如何在使用CUDNN 4時消除構建錯誤?
這聽起來像是0.10版本候選版本中可能存在一個錯誤。你能否用一些關於你的訓練腳本的信息來打開[GitHub問題](https://github.com/tensorflow/tensorflow/issues)?謝謝! – mrry
@ mrry - done,[問題3603](https://github.com/tensorflow/tensorflow/issues/3603) – RobR