2011-10-24 94 views
0

因爲bz2是可拆分的並節省空間,所以我計劃以bzip2格式存儲表格數據。 但是,它似乎沒有識別壓縮格式。 gzip格式很好。 我使用的代碼看起來是這樣的:如何讓Hive與bz2一起工作?

CREATE TABLE IF NOT EXISTS image_bzip (
    image_id STRING, 
    image_feature STRING, 
    other_stuff STRING) 
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE LOCATION '/hivestore/bzip'; 

LOAD DATA LOCAL INPATH '/nfs/directory/*.bz2' OVERWRITE INTO TABLE image_bzip; 

有人能指出我我缺少的是什麼?

謝謝。

回答

1

如果我們正確設置了壓縮編解碼器,它自然地工作。

1

爲什麼不嘗試用HDFS上的bz2壓縮文件創建外部表?