2017-04-18 62 views
2

當我在蜂巢存儲拼花格式文件創建一個分區的外部表。我在該表中有時間戳列,當我加載時間戳列中給出空值的數據時。時間戳數據類型在蜂巢不支持,不讀拼花文件

創建表查詢

CREATE EXTERNAL TABLE abc( timestamp1 timestamp, tagname string, value string, quality bigint, own string) PARTITIONED BY ( etldate string) ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe' STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat' LOCATION 'adl://refdatalakeprod.azuredatalakestore.net/iconic' TBLPROPERTIES ( 'PARQUET.COMPRESS'='SNAPPY');

任何建議,請?

在此先感謝。

+0

您指定'timestamp1 String',這看起來像一個錯字給我嗎?另請注意,Hive中有多個時間戳類型,可能值得在此發佈Parquet文件的架構。你應該能夠通過使用鑲木工具來查找它。 – xhochy

+0

我也嘗試使用timestamp1字段的時間戳數據類型。在拼花支持 – sushma

+0

時間戳的數據類型,你必須是做錯了什麼,而加載數據 –

回答

0

你的問題是wrong.It不是時間戳類型,它是type.I認爲你需要檢查你的數據的字符串。

+0

我試圖給戳,最後我把它作爲字符串00.0其:SS – sushma

+0

如果您嘗試使用字符串類型,但它仍然是空值,那麼我認爲您的原始數據有問題。 –