hiveql

0熱度

1回答

我正在嘗試編寫一個shell腳本，用於比較DB2和Hive行計數並檢查它們是否匹配。雖然這樣做，我正面臨着蜂巢計數問題。，因爲我走在一個文本文件蜂箱數，其未來在以下格式： +---------+--+ | _c0 | +---------+--+ | 713313 | +---------+--+ 後，我在更改屬性，從表到CSV（直線--outputformat = TSV）和現在

0熱度

2回答

SELECT對Hive的疑問SQL

我正在閱讀一些Hive QL腳本，發現這行： SELECT'Start time：'，from_unixtime（unix_timestamp（））; 這是什麼意思？它看起來不像一個真正的「選擇」聲明？

1熱度

1回答

如何分割逗號分隔的字符串並收集蜂巢中的唯一值？

我有一個兩列的配置單元表。兩欄的類型都是字符串。一個是簡單的客戶端ID，另一個是命令分離的項目ID字符串。可以有多個具有相同客戶端ID但具有不同項目ID字符串的行。我想要一個生成帶有兩列的表的配置單元查詢。一個是客戶端ID，另一個是逗號分隔的字符串與所有唯一的項目ID。數據在原表： Client Id Item Ids 1 1,2,3,4 2 3,4,6,8 4 4,

0熱度

2回答

混淆'和'過濾內部

可以解釋HiveQL中這兩個查詢之間的區別。基本上我想從table a過濾掉日期大於2017-05-01。第二個查詢沒有給出我預期的結果，但是第一個查詢得到了結果。我以爲他們是相當於 select a.user_id , b.user_id , a.event_date , b.event_date , to_date(a.event_date) from default.t1 as a

0熱度

2回答

Python腳本來運行Hive查詢

任何人都可以請指導我如何使用Python運行.hql查詢。嘗試過Hiveutils lib，但它在開發環境中不存在。任何其他方式來執行查詢？

-1熱度

2回答

基於一個塔和其他列的SQL

特有的價值觀我有SQL表下面的名字TEST_T SKU_ID DC_ID CRT_DTTM FIELD_NAME TOTAL ------------------------------------------------------------------------ sku1 dc1 2017-08-02 02:28:41.711 FIELD1 5 sku1 d

-1熱度

2回答

HIVE哪裏不存在不比較NULLS

我想只選擇其中一些列值不同的行。我的問題是，如果我使用=，它不會比較具有空值的列，並且如果我用Like替換=，我會得到以下錯誤，任何建議？兩個表具有相同的列不支持的子查詢表達式子查詢表達式引用父表達式和子查詢表達式，並且不是有效的連接條件。（狀態= 42000，代碼= 10249） SELECT * FROM table1 t where not exists( select * from

0熱度

1回答

HQL分割時間爲間隔

我有一些數據的蜂房表和我想它在分割爲15個分鐘間隔等返回的總呼叫持續時間的每個時間間隔蜂巢表例如： ID Start End Total Duration 1 1502296261 1502325061 28800 我的輸出應顯示爲： ID Interval Duration 1 2017-08-09 18:30:00 839 1 2017-0

0熱度

1回答

找到相同的最後兩位數字的員工僱員ID在蜂巢

1熱度

1回答

如何將字符串設置爲hiveconf變量轉換爲可用作表名的一部分的對象

我正在尋找一種方法來從hiveconf變量字符串中刪除引號，以便我可以將其用作表名的一部分： Basicaly，我有一些像 set sub_name = "123"; select ${hiveconf:sub_name} from table_${hiveconf:sub_name}; 和執行的時候，我需要它的工作，如： select "123" from table_123; 對於