hiveql

    0熱度

    1回答

    我正在嘗試編寫一個shell腳本,用於比較DB2和Hive行計數並檢查它們是否匹配。 雖然這樣做,我正面臨着蜂巢計數問題。 ,因爲我走在一個文本文件蜂箱數,其未來在以下格式: +---------+--+ | _c0 | +---------+--+ | 713313 | +---------+--+ 後,我在更改屬性,從表到CSV(直線--outputformat = TSV)和現在

    0熱度

    2回答

    我正在閱讀一些Hive QL腳本,發現這行: SELECT'Start time:',from_unixtime(unix_timestamp()); 這是什麼意思?它看起來不像一個真正的「選擇」聲明?

    1熱度

    1回答

    我有一個兩列的配置單元表。兩欄的類型都是字符串。一個是簡單的客戶端ID,另一個是命令分離的項目ID字符串。可以有多個具有相同客戶端ID但具有不同項目ID字符串的行。 我想要一個生成帶有兩列的表的配置單元查詢。一個是客戶端ID,另一個是逗號分隔的字符串與所有唯一的項目ID。 數據在原表: Client Id Item Ids 1 1,2,3,4 2 3,4,6,8 4 4,

    0熱度

    2回答

    可以解釋HiveQL中這兩個查詢之間的區別。基本上我想從table a過濾掉日期大於2017-05-01。第二個查詢沒有給出我預期的結果,但是第一個查詢得到了結果。我以爲他們是相當於 select a.user_id , b.user_id , a.event_date , b.event_date , to_date(a.event_date) from default.t1 as a

    0熱度

    2回答

    任何人都可以請指導我如何使用Python運行.hql查詢。嘗試過Hiveutils lib,但它在開發環境中不存在。任何其他方式來執行查詢?

    -1熱度

    2回答

    特有的價值觀我有SQL表下面的名字TEST_T SKU_ID DC_ID CRT_DTTM FIELD_NAME TOTAL ------------------------------------------------------------------------ sku1 dc1 2017-08-02 02:28:41.711 FIELD1 5 sku1 d

    -1熱度

    2回答

    我想只選擇其中一些列值不同的行。我的問題是,如果我使用=,它不會比較具有空值的列,並且如果我用Like替換=,我會得到以下錯誤,任何建議?兩個表具有相同的列 不支持的子查詢表達式子查詢表達式引用父表達式和子查詢表達式,並且不是有效的連接條件。 (狀態= 42000,代碼= 10249) SELECT * FROM table1 t where not exists( select * from

    0熱度

    1回答

    我有一些數據的蜂房表和我想它在分割爲15個分鐘間隔等返回的總呼叫持續時間的每個時間間隔 蜂巢表例如: ID Start End Total Duration 1 1502296261 1502325061 28800 我的輸出應顯示爲: ID Interval Duration 1 2017-08-09 18:30:00 839 1 2017-0

    0熱度

    1回答

    我有以下情形在蜂巢 Emp ID | Employee name | Emp salary 112 | Prakash | 33333 212 | Aakash | 5567 322 | Kishore | 565 3242 | hhjh | 76676 4325 | chhh | 565 422 | Ramesh | 34555 我想找出它的最後一個員工ID的

    1熱度

    1回答

    我正在尋找一種方法來從hiveconf變量字符串中刪除引號,以便我可以將其用作表名的一部分: Basicaly,我有一些像 set sub_name = "123"; select ${hiveconf:sub_name} from table_${hiveconf:sub_name}; 和執行的時候,我需要它的工作,如: select "123" from table_123; 對於