2017-02-21 45 views
2

我使用以下參數林:上GC ML部署TF 1.0與GPU的隊列永遠

  • scale_tier = CUSTOM
  • master_type = standard_gpu
  • worker_count = 0
  • ps_count = 0
  • runtime_version = 1.0

日誌顯示消息Job <job_name> is queued.沒有打印我通常會看到的下一條日誌消息(Waiting for job to be provisioned.)。我的工作一直堅持30分鐘,我已經嘗試了兩次。

我嘗試在沒有GPU的情況下提交相同的作業(即scale_tier = BASIC),並將其移至供應階段並最終完成。

可能會發生什麼?

+1

對不起,您有麻煩,請提供一個項目ID和工作ID,以便我們可以調查?如果您不想公開發布它們,可以通過[email protected]以電子郵件的方式私密發送給我們。 –

+0

我已經通過電子郵件發送了項目/工作ID,謝謝! – jwayne

回答

3

事實證明,這個錯誤是因爲我們耗盡了GPU的配額。當我殺死了一些使用GPU的作業時,排隊的作業就進入了配置階段。

謝謝!