-4
A
回答
4
我已經already answered這在以前的問題(見最後段落),但我會再試一次。
與sum(θ)
正規化的問題是,可能必須互相抵消的
實施例θ參數:
θ_1 = +1000000
θ_2 = -1000001
的sum(θ)
這裏是百萬-1000001 = -1是小
sum(θ²)
是1000000²+(-1000001)²這是非常大的。
如果您使用sum(θ)
,您可能會因沒有正規化(這是目標)而導致避免正則化的θ值過大,因爲這些項互相抵消。
根據您的搜索/優化算法,您可以使用sum(|θ|)
。但我知道θ²(L2標準)很受歡迎,並且在梯度下降方面效果很好。
+0
另一個原因是它通過懲罰較大的係數來提供額外的正則化。如果θ很大,那麼θ^ 2將會很大,因此θ的較大值將受到懲罰。所以,這種正則化偏好比sum(|θ|)'更小的theta值 –
相關問題
- 1. 瞭解cos(θ)和正弦(θ)
- 2. 對於無向圖,爲什麼鄰接表表示的內存要求是θ(V + E)而不是θ(V + 2E)?
- 3. 如果klgk =Θ(n),那麼k =Θ(n/lgn)
- 4. 緊(Θ)綁定
- 5. 寫有Θ(nlogn)的算法
- 6. f(n)=Θ(f(n))是真的嗎?
- 7. 梯度下降:θ驅動不收斂
- 8. 爲什麼我們不使用lite-server而不是Gulp?
- 9. 爲什麼我們不使用Repeater Control而不是Gridview Control?
- 10. 爲什麼我們使用HTTP而不是遠程調用?
- 11. 爲什麼我應該使用content_tag而不是「常規」html?
- 12. 如何使用求和符號證明算法是Θ(log n)?
- 13. 爲什麼我們使用`#include「stdafx.h」`而不是`#include <stdafx.h>`?
- 14. 爲什麼我們主要使用LocalDB而不是SQL Server?
- 15. 爲什麼SQLBRITE和我們爲什麼使用它而不是SQLite?
- 16. 當我們提取請求時,爲什麼我們使用Like而不是==?
- 17. 爲什麼我們不使用2-3或2-3-4-5樹?
- 18. 爲什麼我們不能用192.168.1子網掩碼,而不是
- 19. 基於Θ(nlogn)的計算性能
- 20. 循環的θ時間複雜度
- 21. 諧波系列的大θ表示法
- 22. 爲什麼人們在C++中使用`main()`而不是`int main()`?
- 23. 爲什麼我們不能在WCF中使用抽象類而不是接口?
- 24. 爲什麼我們不能引用指針,而是值
- 25. 爲什麼我們在枚舉中寫入Integer而不是int?
- 26. 大寫字母'J'在成本函數J(θ)中意味着什麼?
- 27. 爲什麼我們使用@Echo off/on而不是僅僅使用echo/off?
- 28. 大O符號和θ符號之間的區別,爲什麼(θ)符號適合插入排序來描述其最壞情況下的運行時間?
- 29. 爲什麼我們在定義指針時使用「type * var」而不是「type&var」?
- 30. 爲什麼我們在HashTable中使用哈希代碼而不是索引?
@Ami你怎麼知道他的意思| theta |?是的,使用| theta |是有意義的而不是「theta」,但聲稱別人的問題是在黑暗中拍攝。 – lejlot
@lejlot回想起來,你是對的。 (儘管如此,它仍然是一個錯誤的堆棧交換問題)。 –