2011-02-27 113 views
6

我們知道有一千個分類器,最近有人告訴我說,有人說adaboost就像是出的一個最新的分類算法

  • 有更好的算法(與 在投票的想法)
  • 什麼是藝術的 的狀態classifiers.Do你有一個例子?

回答

1

Hastie et al。 (2013年,統計學習元素)得出結論認爲梯度增壓機是最好的「現成」方法。獨立於您的問題。 定義(參見第352頁): 「現成的」方法是可以直接將數據應用於數據,而不需要耗費大量時間的數據預處理或仔細調整學習過程。事實上,Breiman(NIPS Workshop,1996)提到AdaBoost將樹作爲「世界上最好的現成分類器」(參見Breiman(1998))。

5

首先,adaboost是一種元算法,與您最喜歡的分類器一起使用(在其上)。其次,在一個問題領域工作得很好的分類器在另一個問題領域通常效果不佳。請參閱No Free Lunch維基百科頁面。所以,你的問題不會有答案。不過,瞭解人們在實踐中使用的內容可能很有意思。

+0

那麼,你的人使用什麼??? – cMinor 2011-02-27 16:57:59

2

Weka是一個非常流行和穩定的機器學習庫。它已有相當長的一段時間,並在Java寫。

+0

最近我看到一位博士使用這個,所以我不得不承認你很快就給出了答案。 – cMinor 2011-03-01 00:34:49

3

Weka和Mahout不是算法......他們是機器學習庫。它們包括各種算法的實現。因此,最好的選擇是挑選一個庫並嘗試一些不同的算法,以查看哪個算法最適合您的特定問題(「最佳效果」將成爲培訓成本,分類成本和分類準確度的函數)。

如果是我,我會從樸素貝葉斯,最近鄰居和支持向量機開始。它們代表完善的,廣爲人知的方法,而且有很多不同的折衷。樸素貝葉斯便宜,但不是特別準確。 K-NN在訓練期間價格便宜,但在分類過程中(可能)價格昂貴,而且通常非常準確,可能容易受到過度訓練的影響。支持向量機訓練昂貴,並且有許多元參數需要調整,但它們應用便宜,一般至少與k-NN一樣精確。

如果您告訴我們您想要解決的問題的更多信息,我們可能會提供更專注的建議。但如果你只是在尋找一個真正的算法,那就沒有一個 - 沒有免費午餐定理保證了。