2012-07-19 69 views
0

這是一個愚蠢的問題,但有人不得不問。Mahout是否需要安裝在Hadoop的主節點上?

我試過在本地運行Mahout,哪些工作。現在,我想要由遠程集羣執行工作,而不是本地機器。

那麼,我應該在Hadoop機器上部署Mahout代碼,還是可以通過Hadoop遠程在本地機器界面上製作Mahout?

回答

2

不,您不要自己在Hadoop工作人員上安裝Hadoop程序。那將是一場噩夢。當您通過hadoop jar提供包含所有代碼的JAR文件時,Hadoop會爲您提供幫助。

當您運行Mahout或其他基於Hadoop的本地計算機上運行的是使用Hadoop代碼將信息發送到羣集以開始工作的客戶端程序。該集羣可能是本地的,或者是遠程的 - 對於客戶端的運行方式,客戶端的對話方式並沒有什麼不同。

+0

非常感謝您的回覆! 那麼如果mahout和hadoop駐留在不同的機器上,我該如何指定路徑,例如in $ HADOOP_HOME/bin/hadoop jar $ MAHOUT_HOME/core/target/mahout-core- -job.jar org.apache.mahout.df.tools.Describe -p testdata/glass.data -f testdata/glass.info - d I 9 NL? – user1539129 2012-07-19 21:54:45

+0

是啊,看起來是正確的。您指定一個本地路徑,對客戶端程序是本地的。 Hadoop管理上傳到HDFS集羣,所有人都可以訪問它。 – 2012-07-19 22:40:02