2016-06-10 80 views
0

我使用Mahout中檢索名爲向量的名稱錯誤的k-means含12份文件與下面的命令的幫助目錄集羣:Mahout的集羣:在使用seqdumper

mahout seq2sparse -i /user/manisha1414/dir_001-seqfiles -o /user/manisha1414/dir_001-vectors --maxDFPercent 85 --namedVector 
mahout seqdumper -i /user/manisha1414/dir_001-kmeans-clusters/clusteredPoints/part-m-00000 > ./dir_001-cluster-docs.txt 

我收到以下輸出

Key: 0: Value: wt: 1.0 distance: 47.44299700930014 vec: [{"0":2.386},{"2":1.875},{"9":2.386},{"14":2.386......... 
Key: 11: Value: wt: 1.0 distance: 217.4603558919857 vec: [{"0":2.386},{"2":1.875},{"......... 

我不是在上面的輸出得到向量的IDS。

請幫我在輸出中獲得vector-ids!

回答

0

將序列文件轉換爲向量時使用「--namedVector true」。