2016-08-01 67 views
1

我正在從源代碼編譯當前主版本。如果我編譯使用CUDA 7.5和CUDNN 4.0我碰到下面的編譯錯誤:Tensorflow:RC 0.10 3X慢於0.9

ERROR: /home/rob/tensorflow/tensorflow/contrib/rnn/BUILD:45:1: undeclared inclusion(s) in rule '//tensorflow/contrib/rnn:python/ops/_lstm_ops_gpu': 
this rule is missing dependency declarations for the following files included by 'tensorflow/contrib/rnn/kernels/lstm_ops_gpu.cu.cc': 
'/usr/local/cuda-7.5/include/cuda_runtime.h' 
'/usr/local/cuda-7.5/include/host_config.h' 
'/usr/local/cuda-7.5/include/builtin_types.h' 
[etc...] 

如果我和CUDNN 5.1編譯,一切都可以編譯和運行,但執行時間大約是3倍更長的時間我目前運行的培訓講稿與使用通過pip安裝的0.9.0版本相同。

我也試過的0.10.rc0(GPU)的PIP版本,並看到了同樣的3X減緩與0.9.0版本

我使用Ubuntu 14.04,PY 3.4和特斯拉K40c GPU。 Bazel是0.3.1版本

3X速度減慢0.10.0rc0版本的原因是什麼,並且有什麼方法可以重新獲得先前的性能嗎?

其次,如何在使用CUDNN 4時消除構建錯誤?

+0

這聽起來像是0.10版本候選版本中可能存在一個錯誤。你能否用一些關於你的訓練腳本的信息來打開[GitHub問題](https://github.com/tensorflow/tensorflow/issues)?謝謝! – mrry

+0

@ mrry - done,[問題3603](https://github.com/tensorflow/tensorflow/issues/3603) – RobR

回答

1

0.10.0rc0的相對緩慢是一個正在解決的確認錯誤。更多信息和狀態可以在this thread找到。