lstm

0熱度

1回答

如何在Tensorflow中運行自定義seq2seq學習（使用預先計算的字嵌入）編碼器 - 解碼器？

我需要在Tensorflow中運行編碼器 - 解碼器模型。我發現使用可用的API basic_rnn_seq2seq(encoder_input_data, decoder_input_data, lstm_cell)等，可以創建編碼器 - 解碼器系統。如何在這樣的模型中輸入如word2vec的嵌入？我是意識到我們可以做嵌入式查找，但根據API encoder_input_data是一個大小爲

0熱度

2回答

Tensorflow basic_rnn_seq2seq TypeError：預期的int32，得到類型'浮動'-0.1代替

我想在數據集上運行編碼器 - 解碼器模型。下面是示例代碼： self._input_data = tf.placeholder(tf.int32, [batch_size, num_steps]) self._targets = tf.placeholder(tf.int32, [batch_size, num_steps]) enc_inputs.append(self._input_dat

1熱度

1回答

當LSTM狀態重置

我想實現一個使用張量流進行關鍵字檢測的LSTM神經網絡。我給神經網絡提供了400ms的序列。然而，在訓練過程中，我不想讓LSTM在嘗試學習序列6時記住序列1。那麼如何在訓練期間重置LSTM的狀態。 outputs, state = rnn.rnn(cell, inputs, initial_state=self._initial_state)參數中的initial_state是否允許在整個批次饋入

0熱度

1回答

張量流中迴路的可變範圍

我以張量流實現了LSTM的代碼，並且我的每批都有不同的長度。爲了將數據提供給圖形，我需要有可變長度的輸入列表。我想下面的循環在tensorflow中有一個變量範圍。在創建圖形時，我可以在開始時將其初始化爲特定值，但是不可能進行任何修改。我試圖使用全局列表的長度作爲外部參數，但它不起作用。 self._train_data = [] for _ in range(variable_length)

0熱度

1回答

如何通過Tensorflow/TFLearn中的LSTM同時學習兩個序列？

我在Tensorflow平臺上學習基於LSTM的seq2seq模型。我可以在給定的簡單seq2seq示例上訓練模型。然而，在我必須從給定序列中同時學習兩個序列（例如：同時學習當前序列的前一個序列和下一個序列）的情況下，我們如何做到這一點，即，計算組合誤差從這兩個序列和backpropogate相同的錯誤兩個序列？這裏的代碼段，我現在用的是LSTM代碼（主要來自PTB例如採取：https://gi

0熱度

1回答

LSTM學習速率衰減

我目前正在複製http://karpathy.github.io/2015/05/21/rnn-effectiveness/中描述的char-RNN的代碼。有些代碼已經在tensorflow中實現了，我所指的代碼是https://github.com/sherjilozair/char-rnn-tensorflow/blob/master/train.py我對學習速率衰減存在問題。在代碼中，優化器

1熱度

1回答

正常softmax和採樣softmax之間有什麼區別？

我正在學習seq2seq神經模型，我對常規softmax和採樣softmax感到困惑。我被告知，採樣的softmax主要用於大詞彙量。那麼誰能直觀地解釋兩者之間的區別？

0熱度

1回答

在同一圖表中構建多個模型

我正在嘗試構建兩個預測不同輸出類型的相似模型。一個預測兩個類別，另一個有六個輸出類別。他們的輸入是相同的，他們都是LSTM RNN。我已將培訓和預測分解爲各自文件model1.py，model2.py中的單獨函數。我已在每個模型變量命名同樣的事情的錯誤，這樣，當我打電話分別與predict1從predict2和MODEL1 MODEL2我碰到下面的命名空間的錯誤： ValueError異常：變

1熱度

1回答

張量流這兩種LSTM實現有什麼區別，如何初始化LSTM的8個權矩陣？

我很困惑如何爲LSTM定義權重矩陣。由於LSTM有8個權矩陣，我不知道如何初始化這些權矩陣用於張量流中的LSTM。但後來我遇到了這個implementation，這是完全有道理的，因爲它具有所有8個加權矩陣，但它不使用LSTM的tensorflow實現。它與LSTM方程一致。但是在LSTM的tensorflow implementation中，我不知道如何定義所有這8個加權矩陣，因爲它們是在上面

1熱度

1回答

一對一LSTM

我有一個長度爲1000的數字序列，我把它分成100個長度的序列。所以我最終得到901個長度爲100的序列。讓第一個900爲trainX。 trainY是這些序列的第2到901個。在keras中，我希望構建以下圖片模型：重要的功能是$ X_1 $映射到$ X_2 $，$ X_2 $映射到$ X_3 $等等。忽略我沒有繪製100個單位的事實。在keras中，我知道如何構建$ X_1 $到$ X_