lstm

    0熱度

    1回答

    我有一個艱難的時間使用'初始狀態'參數在tf.nn .nn功能。 val, _ = tf.nn.rnn(cell1, newBatch, initial_state=stateP, dtype=tf.float32) newBatch.shape =>(1,1,11) stateP.shape =>(2,2,1,11) 一般來說,我已經通過用於訓練去我的LSTM神經網絡,現在我想使用它的值。我

    3熱度

    1回答

    我訓練了一個遞歸神經網絡(LSTM)並保存了權重和metagraph。當我檢索metagraph進行預測時,只要序列長度與訓練過程中的序列長度相同,一切都可以正常工作。 LSTM的好處之一是輸入的序列長度可以變化(例如,如果輸入是形成句子的字母,則句子的長度可以變化)。 從metagraph中檢索圖形時,如何更改輸入的序列長度? 更多細節與代碼: 在培訓過程中,我使用佔位符x和y養活數據。對於預測

    5熱度

    1回答

    我想在使用minibatches的Tensorflow中訓練LSTM,但是訓練完成後我想通過一次提交一個示例來使用模型。我可以在Tensorflow中設置圖形來訓練我的LSTM網絡,但是我不能以我想要的方式使用訓練後的結果。 設置代碼看起來是這樣的: #Build the LSTM model. cellRaw = rnn_cell.BasicLSTMCell(LAYER_SIZE) cell

    1熱度

    1回答

    重用LSTM的可變我試圖用LSTM使RNN。 我製作了LSTM模型,之後它有兩個DNN網絡和一個迴歸輸出層。 我訓練我的數據,並最終喪失培訓成爲約0.009。 但是,當我將模型應用於測試數據時,損失約爲0.5。 第一次時代訓練損失約爲0.5。 所以,我認爲訓練的變量不用於測試模型。 訓練和測試模型之間的唯一區別是批量大小。 Trainning Batch = 100~200,Test Batch

    3熱度

    2回答

    堆棧LSTM層 我有什麼是下面的,我相信這是一個隱藏LSTM層的網絡: # Parameters learning rate = 0.001 training_iters = 100000 batch_size = 128 display_step = 10 # Network Parameters n_input = 13 n_steps = 10 n_hidden = 512

    2熱度

    1回答

    我試圖使用使用Keras預測未來購買的LSTM經常性神經網絡。我的輸入變量是過去5天購買的時間窗口,以及編碼爲虛擬變量A, B, ...,I的分類變量。我的輸入數據看起來像以下: >>> dataframe.head() day price A B C D E F G H I TS_bigHolidays 0 2015-06-16 7.031160 1 0 0 0 0 0 0 0

    4熱度

    1回答

    我在做一個使用keras的語言模型。 基本上,我的詞彙量N是〜30.000,我已經在它上面訓練了一個word2vec,所以我使用了嵌入,然後是LSTM,然後我用完全連接的層和s​​oftmax來預測下一個單詞。 我的模型寫成如下: EMBEDDING_DIM = 256 embedding_layer = Embedding(N,EMBEDDING_DIM,weights=[embeddings

    2熱度

    2回答

    該模型具有LSTM作爲其第一層。 當調用model.predict說你幾個樣品中傳遞: >sam = np.array([ [[.5, .6, .3]], [[.6, .6, .3]], [[.5, .6, .3]] ]) >model.predict(sam) array([[ 0.23589483], [ 0.2327884 ], [ 0.23589483]])

    2熱度

    1回答

    我試圖在張量流中創建具有GRU單元(以及LSTM單元)的多層遞歸神經網絡。我看了多個來源,包括官方教程。但是我一直看到下面的多層RNN模式(這裏用GRU單元顯示)。 cell = GRUCell(num_neurons) # Or LSTMCell(num_neurons) cell = DropoutWrapper(cell, output_keep_prob=dropout) cell =

    1熱度

    1回答

    我正在運行TensorFlow的RNN(LSTM)語言模型示例here。 它運行並完美地報告困惑。 我想,雖然什麼是三件事情: 給定一個序列(例如W1 W5 W2000 W750)給我過的詞彙的下一個單詞的概率分佈。我不知道如何在教程中使用模型。 我希望模型返回最可能序列的排名(例如n-grams),可以給出n作爲輸入。 和 給定一個序列,我想這是概率。 我是TensorFlow和RNN的新手,所