我試圖構建一個只有下面的功能或這些功能的組合的配置單元查詢。例如,所述特徵包括具有某些特定排除條件的Hive查詢
名稱= 「摘要」
名稱= 「細節」
NAME1 = 「車輛統計」
NAME1 = 「加速度」
我不得不統計嚴格遵守上述條件的客戶數量。例如,在下表中,不應該計算顧客「歡樂」,因爲儘管他在名稱和「車輛狀態」和「加速度計」中都具有「摘要」和「細節」在name1中。
同樣,客戶「Lan」不應該被計算在內,因爲他在名稱1中另外做了「超速」,而不是在上述條件中。
customername name name1
Joy summary vehicle stats
Joy details accelerometer
Joy expenses speeding
Lan summary vehicle stats
Lan details accelerometer
Lan details speeding
Hana details accelerometer
Hana summary vehicle stats
計數如下表必須是1,因爲只有1個客戶(花)誰曾做過名1只「摘要」,並命名爲「細節」和「汽車統計」和 「加速度」 。
這是我目前擁有的查詢:
select name, name1, count(distinct(customername))
from table1
where date_time between "2017-01-01 00:00:00" and "2017-01-10 00:00:00"
group by name, name1
having name in ('summary', 'details')
or name1 in ('vehicle stats', 'accelerometer')
任何建議將是偉大的!
客戶是否需要全部4個屬性,或1個就足夠了? –