1
當我定義一個TF1.0自定義model_fn時,我想停止訓練,當失敗是楠。我想下面的代碼在model_fn:tf.train.NanTensorHook(loss,fail_on_nan_loss = False)仍然會引發TF1.0異常
return model_fn_lib.ModelFnOps(
mode=mode,
predictions=predictions_dict,
loss=loss,
train_op=train_op,
eval_metric_ops=eval_metric_ops,
training_hooks=[tf.train.NanTensorHook(loss, fail_on_nan_loss=False)])
但fail_on_nan_loss =假仍然會拋出異常,我希望它會寫警告消息並沒有引發異常停止具體培訓。
有關如何正確使用tf.train.NanTensorHook的任何建議?
這是需要使用Hyperparams來查找哪些組合設置更好,如[鏈接]中所建議的(http://www.michael-remington.com/machine/learning/tensorflow/neural/networks/2016/06/ 25/tflearn-tutorial.html)。您不希望由於引發的異常導致大循環被打亂。 – xiyulangzi