lstm

    0熱度

    1回答

    我需要在Tensorflow中運行編碼器 - 解碼器模型。我發現使用可用的API basic_rnn_seq2seq(encoder_input_data, decoder_input_data, lstm_cell)等,可以創建編碼器 - 解碼器系統。 如何在這樣的模型中輸入如word2vec的嵌入?我是 意識到我們可以做嵌入式查找,但根據API encoder_input_data是一個大小爲

    0熱度

    2回答

    我想在數據集上運行編碼器 - 解碼器模型。下面是示例代碼: self._input_data = tf.placeholder(tf.int32, [batch_size, num_steps]) self._targets = tf.placeholder(tf.int32, [batch_size, num_steps]) enc_inputs.append(self._input_dat

    1熱度

    1回答

    我想實現一個使用張量流進行關鍵字檢測的LSTM神經網絡。我給神經網絡提供了400ms的序列。然而,在訓練過程中,我不想讓LSTM在嘗試學習序列6時記住序列1。那麼如何在訓練期間重置LSTM的狀態。 outputs, state = rnn.rnn(cell, inputs, initial_state=self._initial_state)參數中的initial_state是否允許在整個批次饋入

    0熱度

    1回答

    我以張量流實現了LSTM的代碼,並且我的每批都有不同的長度。爲了將數據提供給圖形,我需要有可變長度的輸入列表。 我想下面的循環在tensorflow中有一個變量範圍。在創建圖形時,我可以在開始時將其初始化爲特定值,但是不可能進行任何修改。我試圖使用全局列表的長度作爲外部參數,但它不起作用。 self._train_data = [] for _ in range(variable_length)

    0熱度

    1回答

    我在Tensorflow平臺上學習基於LSTM的seq2seq模型。我可以在給定的簡單seq2seq示例上訓練模型。然而,在我必須從給定序列中同時學習兩個序列(例如:同時學習當前序列的前一個序列和下一個序列)的情況下,我們如何做到這一點,即,計算組合誤差從這兩個序列和backpropogate相同的錯誤兩個序列? 這裏的代碼段,我現在用的是LSTM代碼(主要來自PTB例如採取:https://gi

    0熱度

    1回答

    我目前正在複製http://karpathy.github.io/2015/05/21/rnn-effectiveness/中描述的char-RNN的代碼。有些代碼已經在tensorflow中實現了,我所指的代碼是https://github.com/sherjilozair/char-rnn-tensorflow/blob/master/train.py我對學習速率衰減存在問題。在代碼中,優化器

    1熱度

    1回答

    我正在學習seq2seq神經模型,我對常規softmax和採樣softmax感到困惑。我被告知,採樣的softmax主要用於大詞彙量。那麼誰能直觀地解釋兩者之間的區別?

    0熱度

    1回答

    我正在嘗試構建兩個預測不同輸出類型的相似模型。一個預測兩個類別,另一個有六個輸出類別。他們的輸入是相同的,他們都是LSTM RNN。 我已將培訓和預測分解爲各自文件model1.py,model2.py中的單獨函數。 我已在每個模型變量命名同樣的事情的錯誤,這樣,當我打電話分別與predict1從predict2和MODEL1 MODEL2我碰到下面的命名空間的錯誤: ValueError異常:變

    1熱度

    1回答

    我很困惑如何爲LSTM定義權重矩陣。由於LSTM有8個權矩陣,我不知道如何初始化這些權矩陣用於張量流中的LSTM。 但後來我遇到了這個implementation,這是完全有道理的,因爲它具有所有8個加權矩陣,但它不使用LSTM的tensorflow實現。它與LSTM方程一致。但是在LSTM的tensorflow implementation中,我不知道如何定義所有這8個加權矩陣,因爲它們是在上面

    1熱度

    1回答

    我有一個長度爲1000的數字序列,我把它分成100個長度的序列。所以我最終得到901個長度爲100的序列。讓第一個900爲trainX。 trainY是這些序列的第2到901個。 在keras中,我希望構建以下圖片模型:重要的功能是$ X_1 $映射到$ X_2 $,$ X_2 $映射到$ X_3 $等等。忽略我沒有繪製100個單位的事實。 在keras中,我知道如何構建$ X_1 $到$ X_