我一直在努力獲得反向傳播的一些熟練,並且已經運行了標準的數學公式來做到這一點。我實施了一個似乎可以正常工作的解決方案(並通過了有關飛行顏色的相關測試)。反向傳播公式似乎無法實現
但是...實際的解決方案(在MATLAB中實現,並使用向量化)在兩個重要方面與公式不一致。
的計算公式如下:
三角二層=(θ-二層轉)×Δ-三層點X gprime( - 現在並不重要)
工作代碼如下所示:
% d3 is delta3, d2 is delta2, Theta2 is minus the bias column
% dimensions: d3--[5000x10], d2--[5000x25], Theta2--[10x25]
d3 = (a3 - y2);
d2 = (d3 * Theta2) .* gPrime(z2);
我無法調和一下我用數學公式來實現,基於兩點:
- 工作代碼反轉表達式第一部分中的術語;
- 工作代碼不轉置theta- layer2,但公式確實。
這怎麼可能?單個矩陣的尺寸似乎不允許任何其他工作組合。
喬希
它可能只取決於設置,兩個實現如何定義矩陣。注意你不能做'Theta2'。 * d2'具有給定的尺寸。 – David
哦,我注意到了。這就是促使我首先發布這個問題的原因。 –