2016-08-20 86 views
-4

enter image description here在正規化,爲什麼我們θ^ 2使用,而不是θ?

正則是拉姆達*總和(θ^ 2)

+0

@Ami你怎麼知道他的意思| theta |?是的,使用| theta |是有意義的而不是「theta」,但聲稱別人的問題是在黑暗中拍攝。 – lejlot

+1

@lejlot回想起來,你是對的。 (儘管如此,它仍然是一個錯誤的堆棧交換問題)。 –

回答

4

我已經already answered這在以前的問題(見最後段落),但我會再試一次。

sum(θ)正規化的問題是,可能必須互相抵消的

實施例θ參數:

θ_1 = +1000000 
θ_2 = -1000001 

sum(θ)這裏是百萬-1000001 = -1是小

sum(θ²)是1000000²+(-1000001)²這是非常大的。

如果您使用sum(θ),您可能會因沒有正規化(這是目標)而導致避免正則化的θ值過大,因爲這些項互相抵消。

根據您的搜索/優化算法,您可以使用sum(|θ|)。但我知道θ²(L2標準)很受歡迎,並且在梯度下降方面效果很好。

+0

另一個原因是它通過懲罰較大的係數來提供額外的正則化。如果θ很大,那麼θ^ 2將會很大,因此θ的較大值將受到懲罰。所以,這種正則化偏好比sum(|θ|)'更小的theta值 –

相關問題