張量流中tf.nn.dynamic_rnn和tf.nn.raw_rnn有什麼區別？

我通過了this tutorial。在最後一塊中，它表示dynamic_rnn函數不適用於計算注意力。但是我不明白的是，我們需要的只是解碼器的隱藏狀態，以便找到編碼器符號可以解決的問題。張量流中tf.nn.dynamic_rnn和tf.nn.raw_rnn有什麼區別？

編碼器的隱藏狀態在注意機制 –

好一個使用。這就像我們在5月份玩的原始RNN一樣。新的關注點，編碼方法等等對嗎？ –

編碼器 - 解碼器環境中的注意機制意味着解碼器在每個時間步「參加」編碼器的「有用」部分。例如，這被實現爲平均編碼器的輸出並且在給定的時間步將該值（稱爲上下文）饋送到解碼器中。

dynamic_rnn計算所有時間步長的LSTM細胞的輸出並給出最終值。因此，沒有辦法告訴模型，在步驟t的單元狀態不僅應該依賴於前一個單元和輸入的輸出，還應該依賴於附加信息，例如上下文。您可以使用raw_rnn來控制編碼器或解碼器LSTM的每個時間步的計算。

如果我理解正確，在本教程中，作者在每個時間步將地面真值輸入作爲輸入提供給解碼器。但是，這不是通常的做法。通常，您想在時間將t處解碼器的輸出作爲輸入饋送給解碼器。簡而言之，在每個時間步驟對解碼器的輸入是可變的，而在dynamic_rnn中則是預定義的。

請參考更多的技術細節：https://arxiv.org/abs/1409.0473

2017-12-13 16:46:24 Asterisk

回答