2010-10-31 68 views
0

我想弄清楚如何運行hadoop的mahout jar示例。我配置象夫和Hadoop,現在我在Hadoop的目錄輸入和輸入是這樣的:如何執行hadoop安裝mahout

/Users/hadoop/hadoop-0.20.2/bin/hadoop jar /Users/hadoop/trunk/examples/mahout-examples-0.5-SNAPSHOT-job.jar org.apache.mahout.SpareVectorsFromSequenceFile -w -i ratings -o ratings_vectors

但我想,我的目標是爲Grouplens數據集執行Hadoop作業。我執行put命令將我的ratings.dat上傳到Hadoop,然後呢?該命令給我始終是這樣的:

Exception in thread "main" java.lang.ClassNotFoundException: org.apache.mahout.SpareVectorsFromSequenceFile 
at java.net.URLClassLoader$1.run(URLClassLoader.java:202) 
at java.security.AccessController.doPrivileged(Native Method) 
at java.net.URLClassLoader.findClass(URLClassLoader.java:190) 
at java.lang.ClassLoader.loadClass(ClassLoader.java:307) 
at java.lang.ClassLoader.loadClass(ClassLoader.java:248) 
at java.lang.Class.forName0(Native Method) 
at java.lang.Class.forName(Class.java:247) 
at org.apache.hadoop.util.RunJar.main(RunJar.java:149) 

我的問題是:

  • 如何設置在Hadoop中DIR正確的道路,叫象夫?
  • 如何使用org.apache.mahout.cf.taste.example.grouplens.GroupLensRecommenderEvaluatorRunner來計算我的hadoop數據ratings.dat?

非常感謝你,我用Hadoop和Mahout的開始;)

回答

1

你有一個錯字。它們是「稀疏載體」,而不是「備用載體」。見SpareVectorsFromSequenceFile,應該是SparseVectorsFromSequenceFile