2012-10-30 62 views
0

在蜂巢0.8用Hadoop 1.03考慮這個表:HIVE爲了通過弄亂數據

CREATE TABLE table (
    key int, 
    date timestamp, 
    name string, 
    surname string, 
    height int, 
    weight int, 
    age int) 
CLUSTERED BY(key) INTO 128 BUCKETS 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY ','; 

然後我嘗試:

select * 
from table 
where key=xxx 
order by date; 

結果進行排序,但列名後,一切都不如意。實際上,所有行在各自的字段中都具有完全相同的值,並且姓氏列缺失。我也有名字和姓氏的位圖索引和關鍵索引。

我的查詢有什麼問題,或者我應該查看有關順序的錯誤(我找不到任何具體的東西)。

回答

0

似乎在將數據加載到配置單元中時出現錯誤。確保您的CSV文件中沒有可能會干擾插入的特殊字符。

而且您已通過關鍵屬性進行聚類。此密鑰來自CSV的位置在哪裏?或其他來源?你確定這是獨一無二的嗎?

+0

如果我嘗試相同的查詢沒有順序,然後結果就好了。所以它不能是任何特殊的人物問題。關鍵是獨一無二的。 – user1676389