當我在蜂巢存儲拼花格式文件創建一個分區的外部表。我在該表中有時間戳列,當我加載時間戳列中給出空值的數據時。時間戳數據類型在蜂巢不支持,不讀拼花文件
創建表查詢
CREATE EXTERNAL TABLE abc( timestamp1 timestamp, tagname string, value string, quality bigint, own string) PARTITIONED BY ( etldate string) ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe' STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat' LOCATION 'adl://refdatalakeprod.azuredatalakestore.net/iconic' TBLPROPERTIES ( 'PARQUET.COMPRESS'='SNAPPY');
任何建議,請?
在此先感謝。
您指定'timestamp1 String',這看起來像一個錯字給我嗎?另請注意,Hive中有多個時間戳類型,可能值得在此發佈Parquet文件的架構。你應該能夠通過使用鑲木工具來查找它。 – xhochy
我也嘗試使用timestamp1字段的時間戳數據類型。在拼花支持 – sushma
時間戳的數據類型,你必須是做錯了什麼,而加載數據 –