tensorflow中`apply_gradients`和`minimize`優化器之間的區別

我對張量流中優化器的apply_gradients和minimize之間的區別感到困惑。例如，tensorflow中`apply_gradients`和`minimize`優化器之間的區別

optimizer = tf.train.AdamOptimizer(1e-3) 
grads_and_vars = optimizer.compute_gradients(cnn.loss) 
train_op = optimizer.apply_gradients(grads_and_vars, global_step=global_step)

和

optimizer = tf.train.AdamOptimizer(1e-3) 
train_op = optimizer.minimize(cnn.loss, global_step=global_step)

他們是同一的確？

如果我想衰減學習的學習率，我可以使用下面的代碼嗎？

global_step = tf.Variable(0, name="global_step", trainable=False) 
starter_learning_rate = 1e-3 
learning_rate = tf.train.exponential_decay(starter_learning_rate, global_step, 
             100, FLAGS.decay_rate, staircase=True) 
# Passing global_step to minimize() will increment it at each step. 
learning_step = (
    optimizer = tf.train.AdamOptimizer(learning_rate) 
    grads_and_vars = optimizer.compute_gradients(cnn.loss) 
    train_op = optimizer.apply_gradients(grads_and_vars, global_step=global_step) 
)

感謝您的幫助！

來源

2017-08-03 Panfeng Li

您可以通過鏈接輕鬆知道：https://www.tensorflow.org/get_started/get_started （tf.train API部分），他們實際上執行相同的工作。不同之處在於：如果使用分隔函數（tf.gradients，tf.apply_gradients），則可以在它們之間應用其他機制，例如漸變裁剪。

來源

2017-08-03 04:20:01

更好地解釋這個文檔的鏈接是https://www.tensorflow.org/api_docs/python/tf/train/Optimizer。 –

tensorflow中`apply_gradients`和`minimize`優化器之間的區別

回答

相關問題