2012-07-12 102 views
2

除了Mahout之外,還有哪些其他框架用於在JAVA中實現機器學習算法,使底層框架採用JAVA代碼並在Hadoop上運行它?使用Hadoop的機器學習框架

我尋找替代亨利馬烏因爲我需要一個SVM和Hadoop的一個聚集集簇實現的,只有SVM在Mahout的支持。

+0

在hadoop上本機運行並且可靠/穩定/成熟/無論什麼?沒有我知道的。你能否說Mahout有什麼問題,你正在尋找替代品?這將使回答這個問題變得更容易。 – 2012-07-12 09:59:07

+0

我創建了Mahout的非分佈式Mahout推薦器,以及部分基於Hadoop的推薦器。我目前正在開發基於Mahout的下一代系統,名爲Myrrix(http://myrrix.com),其中包含基於Hadoop的推薦器實現。不知道它是你想要的,但如果你對Hadoop + Mahout感興趣,那麼它是相關的。 – 2012-07-12 10:58:01

回答

-1

快速谷歌搜索提供了以下

http://java-ml.sourceforge.net/ - 經過近3年,有一個釋放。不知道它的支持程度以及執行哪些算法。

http://sourceforge.net/projects/weka/ - 最近被他人的一些建議看起來不錯。

此外,請參閱此thread

沒有嘗試過他們兩人。

+1

我不相信他們在hadoop本身運行。或者他們呢? – 2012-07-12 09:57:50

+3

這些不是與Hadoop相關的。韋卡雖然很成熟。 – 2012-07-12 10:58:48

+1

是的,對不起,我錯過了Hadoop的一部分。 – 2012-07-12 11:50:58

0

那麼,如果SVM是在Hadoop上,剩下的就是容易實現!

注意,幼稚凝聚聚類算法是沒有效率的大數據(O(N^2)的複雜性)。這種複雜性使得它無法在大型數據集即使在一個大的集羣中運行的算法,除非你試試它的擴展的一個像這樣的:ftp://193.167.42.127/franti/papers/GraphPnn-TPAMI.pdf