2010-07-02 89 views
40

Weka可能是最受歡迎的通用機器學習庫。但是我的經驗可能會很慢。最快的通用機器學習庫?

我一直在看SharkWafflesdlibPlearn,並MLC++作爲替代品。其中,Shark和dlib看起來最有前途。

有沒有人有任何經驗,當涉及到這些庫的性能測試?

+0

您可能也會對http://code.google.com/p/eureqa-api/感興趣,它會發現高性能的公式查找 – Inverse 2010-07-02 18:28:11

+0

完全取決於您想要學習的哪種模型。 CRF? SVM?嗯? – bmargulies 2010-07-04 02:55:05

+4

Weka **非常慢**。 – 2012-06-29 08:58:06

回答

39

對我來說,最重要的是「這個工具包是否具有我想要嘗試的算法或功能?」由於這些工具包提供了相當多樣化的功能,因此您應該首先嚐試縮小您想要執行的操作。因此,例如,如果您有一個渴望嘗試不同進化優化算法的願望,那麼我會選擇Shark這樣的東西。另一方面,我更喜歡dlib作爲我的大部分工作,但這並不意味着很多,因爲我寫了:)但是,如果您對二進制分類感興趣,那麼讓我建議我目前的最愛方法爲,svm_c_ekm_trainer。我經常使用它來訓練數十萬數據集上的非線性SVM。它通常運行幾分鐘(有時甚至幾秒鐘),而經典的SMO算法則需要數小時或數天才能完成。

對於不久前提出的類似問題,也有一些很好的答案:Which machine learning library to use

+1

謝謝戴維斯!用dlib做的很棒!我真的只是在尋找具有很多功能的東西,以便我可以在大多數情況下使用它,但是可以根據需要分支出其他東西。 – griffin 2010-07-06 13:48:20