2017-04-25 51 views
0

我想加載一個標籤分離文件到hbase。我得到了屏幕截圖中提到的錯誤,請指教。加載標籤分離格式txt文件到Hbase

文件內容:

2 1/1/16 0:29 1/1/16 0:39 
2 1/1/16 0:19 1/1/16 0:39 
2 1/1/16 0:19 1/1/16 0:39 
2 1/1/16 0:22 1/1/16 0:38 
2 1/1/16 0:24 1/1/16 0:39 
2 1/1/16 0:32 1/1/16 0:39 

查詢:

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns= HBASE_ROW_KEY,id,date:c1,date:c2 sample1 hdfs://localhost:9000/FinalProject/Hbase/samplehbase.txt 

enter image description here

回答

1

你不應該執行內hbase shellImportsv聲明。

hbase(main)> create 'sample1', 'date' 

-Dimporttsv.columns="HBASE_ROW_KEY,id,date:c1,date:c2" 

sample1表只有一個列族dateid不是列家族,請將其從columns中刪除。

嘗試,

~$ hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns="HBASE_ROW_KEY,date:c1,date:c2" sample1 hdfs://localhost:9000/FinalProject/Hbase/samplehbase.txt 

而在你的樣本數據,所有的記錄有相同的行鍵。在導入時,默認情況下,只有最後一行將保留在表中,作爲列系列的默認值爲VERSIONS => 1。考慮在運行導入之前增加VERSIONS

hbase(main)> alter 'sample1',{NAME=>'date',VERSIONS=>6} 
+1

它工作。非常感謝您的指導。 – Harish

+0

你能幫我創建hbase表的索引嗎? – Harish