在正規化，爲什麼我們θ^ 2使用，而不是θ？

-4

正則是拉姆達*總和（θ^ 2）

2016-08-20 C.J

@Ami你怎麼知道他的意思| theta |？是的，使用| theta |是有意義的而不是「theta」，但聲稱別人的問題是在黑暗中拍攝。 – lejlot

@lejlot回想起來，你是對的。（儘管如此，它仍然是一個錯誤的堆棧交換問題）。 –

_{我已經already answered這在以前的問題（見最後段落），但我會再試一次。}

與sum(θ)正規化的問題是，可能必須互相抵消的

實施例θ參數：

θ_1 = +1000000 
θ_2 = -1000001

的sum(θ)這裏是百萬-1000001 = -1是小

sum(θ²)是1000000²+（-1000001）²這是非常大的。

如果您使用sum(θ)，您可能會因沒有正規化（這是目標）而導致避免正則化的θ值過大，因爲這些項互相抵消。

根據您的搜索/優化算法，您可以使用sum(|θ|)。但我知道θ²（L2標準）很受歡迎，並且在梯度下降方面效果很好。

2016-08-20 13:25:41 bakkal

另一個原因是它通過懲罰較大的係數來提供額外的正則化。如果θ很大，那麼θ^ 2將會很大，因此θ的較大值將受到懲罰。所以，這種正則化偏好比sum（|θ|）'更小的theta值 –

回答