2017-06-29 66 views
4

我正在運行docker image tensorflow:1.1.0。我已經添加了tensorflow對象檢測api github,通過在本地克隆它併爲我的docker連接到該文件夾​​。我正試圖重新創建他們的寵物示例。Tensorflow對象檢測開始之前已被殺死

我相信我有正確的地方所有的代碼和代碼。然而,當我嘗試重新訓練時,tensorflow會在開始訓練之前自殺,但不會帶來任何問題或錯誤。

INFO:tensorflow:Starting Session. 
INFO:tensorflow:Starting Queues. 
INFO:tensorflow:global_step/sec: 0 
Killed 

我想我有一些東西out或oder,但沒有任何錯誤或輸出,我不知道在哪裏看!

我按照這裏的指南在本地運行的東西:link。寵物數據來自同一個GitHub:link。我也從同一個GitHub獲得了我的模型配置。 link

我選擇inception_v2。

+0

你能提供更多關於你的設置的信息嗎?什麼是您正在運行的docker run命令(或等效命令)?你能提供一個鏈接到這個「寵物榜樣」嗎? – programmerq

+0

我用這段代碼啓動我的碼頭: docker run -it --rm --name bob -p 1000:8888 -v /Users/.../tensorflow/models:/notebooks tensorflow/tensorflow:1.1.0 其中tensorflow/models包含我的模型GitHub的本地副本。 –

+0

我遇到同樣的問題,但我的程序進一步了一點。 INFO:tensorflow:啓動隊列。 INFO:tensorflow:global_step/sec:0 INFO:tensorflow:在第0步記錄總結。 INFO:tensorflow:global step 1:loss = 0.6946(6.841 sec/step) ' –

回答

0

我現在意識到我剛剛開始時就內存不足了。當我切換到ssd_mobilenet_v1_coco_2017_11_17並更改batch_size = 1時,它一切正常。

雖然這仍然不能完全解決我的問題。我必須弄清楚如何爲呼叫提供更多的內存。