2012-07-18 70 views
0

我一直在Cloudera演示VM中使用Mahout進行試驗,並已成功將示例綜合控制數據(https://cwiki.apache.org/MAHOUT/clustering-of-synthetic-control -data.html)使用k-Means算法。我使用了ClusterDumper並可以查看Mahout輸出,但現在我想將輸出放入Hive表中。我會如何去做這件事?將羣集數據從HDFS移動到Hive

回答

1

沒有直接的整合。最好的辦法是修改ClusterDumper以產生某種文本表示形式,並將其作爲表格數據導入到Hive中。

0

在Hive中創建一個外部表,它應該指向Mahout o/p路徑。