Tensorflow爲不同的訓練輸入參數返回相同的結果

我想在R中實現張量流預測函數，但預測結果總是相同的，不管輸入參數是什麼。Tensorflow爲不同的訓練輸入參數返回相同的結果

我試圖保持真正接近官方tutorial。

我的訓練數據形成了7個變量的data.frame。第一個是結果。其結果是0或1

我完整的代碼：

sess <- tf$InteractiveSession() 

x <- tf$placeholder(tf$float32, shape(NULL,6L)) 
y_ <- tf$placeholder(tf$float32, shape(NULL,2L)) 

W <- tf$Variable(tf$zeros(shape(6L, 1L))) 
b <- tf$Variable(tf$zeros(shape(2L))) 

sess$run(tf$global_variables_initializer()) 
y <- tf$nn$softmax(tf$matmul(x,W) + b) 
cross_entropy <- tf$reduce_mean(-tf$reduce_sum(y_ * tf$log(y), reduction_indices=1L)) 
optimizer <- tf$train$GradientDescentOptimizer(0.5) 
train_step <- optimizer$minimize(cross_entropy) 

i = 1 
while (i < (nrow(training_data)-20)) { 
    print(i) 
    batch_ys <- matrix(c(training_data[i:(i+19),1], abs(training_data[i:(i+19),1]-1)), nrow=20) 
    batch_xs <- matrix(c(training_data[i:(i+19),2],training_data[i:(i+19),3],training_data[i:(i+19),4],training_data[i:(i+19),5],training_data[i:(i+19),6],training_data[i:(i+19),7]), nrow=20, ncol=6) 

    sess$run(train_step, feed_dict = dict(x = batch_xs, y_ = batch_ys)) 
    i = i + 20 
}

而且隨着訓練數據

# Simple verification 
for (j in 1:30){ 
    test_data <- c(training_data[j,2],training_data[j,3],training_data[j,4],training_data[j,5],training_data[j,6],training_data[j,7]) 
    test_data <- matrix(test_data, nrow = 1, ncol = 6) 
    feed_dict = dict(x= test_data) 
    print('############') 
    print(sess$run(y,feed_dict)) # this is always the same 
    print(training_data[j,1]) 
}

的第一個項目一個簡單的檢查我預期的預測依賴在輸入，但它返回：

[1] "############" 
    [,1] [,2] [,3] [,4] [,5] [,6] 
[1,] 2 2 4 74 5 2 
     [,1]  [,2] 
[1,] 0.0657808 0.9342192 
[1] 1 
[1] "############" 
    [,1] [,2] [,3] [,4] [,5] [,6] 
[1,] 0 1 5 61 2 3 
     [,1]  [,2] 
[1,] 0.0657808 0.9342192 
[1] 0 
[1] "############" 
    [,1] [,2] [,3] [,4] [,5] [,6] 
[1,] 3 2 6 85 5 4 
     [,1]  [,2] 
[1,] 0.0657808 0.9342192 
[1] 0

我做錯了什麼？

感謝，

巴斯蒂安

來源

2017-07-17 user2667549

我想通了，爲什麼它不適用於數據。該代碼工作得很好，但輸入數據沒有在0和1之間縮放。

我想所有超過1的值都設置爲1（例如32kg - > 1），所以nnet僅被訓練表格填充爲1.由於每個輸出分類的輸入值相同，結果是一個常數值。

來源

2017-08-12 11:09:54 user2667549

看來，問題是在這條線：

W <- tf$Variable(tf$zeros(shape(6L, 1L)))

當你初始化用零權重矩陣，所有的梯度將是零和。所以，即使經過一些訓練迭代W仍然是一個零矩陣。解決方案是使用小的隨機值來初始化這個矩陣。

來源

2017-07-17 20:43:15

我試圖用'tf $ random_normal'初始化W，但問題仍然存在。 – user2667549

Tensorflow爲不同的訓練輸入參數返回相同的結果

回答

相關問題