我已經定義了一個蜂巢表,其中一列包含JSON文本:Presto/Athena - 查詢發現JSON屬性頻率?
CREATE EXTERNAL TABLE IF NOT EXISTS my.rawdata (
json string
)
PARTITIONED BY (dt string)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
'separatorChar' = '\n',
'quoteChar' = '\0',
'escapeChar' = '\r'
)
STORED AS TEXTFILE
LOCATION 's3://mydata/';
是否有普雷斯托/雅典娜查詢可以列出了JSON內發生的所有字段名和它們的頻率(即總數該屬性出現在表中)?
P.S.的鑰匙表格定義是一團糟。 OpenCSVSerde? quoteChar? escapeChar? –