hiveql

    0熱度

    2回答

    我的數據是這樣的: 我希望獲取與出現的小時間每dtcode的第一條記錄。 所需的輸出: 通過使用Scala的,我想取。 請指導我構建邏輯。 謝謝, Syam。

    0熱度

    1回答

    我想獲取非現有的數據爲空使用外部爆炸蜂巢中,但我的查詢不返回任何東西。 編輯: 表 - 年線,companyrank year:string,topcompanies:array<struct<name:string,rank:string>> 樣本數據 編輯: 2015, "topcompanies":[ {"name":"apple","rank":"1"},

    0熱度

    1回答

    在蜂房裏,能變更託管/外部表的位置 如果是的話。改變位置後,將它表現得像外部表或內部表

    -1熱度

    2回答

    看我試圖分析太多文件到一個HIVE表中。關鍵的見解,我正在與json文件和表結構是: CREATE EXTERNAL TABLE test1 ( STATIONS ARRAY<STRING>, SCHEMESUSPENDED STRING, TIMELOAD TIMESTAMP ) ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonS

    -3熱度

    2回答

    我有一個表在RDBMS像這樣: create table test (sno number, entry_date date default sysdate). 現在我想創建一個蜂巢表的結構如添加一個默認值的列。

    1熱度

    1回答

    我有下表獲取增量更新。我需要編寫一個普通的Hive查詢來合併具有相同鍵值和最新值的行。 Key | A | B | C | Timestamp K1 | X | Null | Null | 2015-05-03 K1 | Null | Y | Z | 2015-05-02 K1 | Foo | Bar | Baz | 2015-05-01 想要得到的: Key | A | B | C |

    -1熱度

    1回答

    我有兩列看起來像這樣在一個蜂巢表: Seconds_col Timestamp_col 87 2017-09-25 08:06:00.0 59 2017-09-25 08:10:00.0 我試圖創建另一個時間戳列是seconds_col + timestamp_col的總和,但我有問題搞清楚如何將類型爲BIGInt的seconds_col加入Timestamp_

    0熱度

    2回答

    我有這樣 A1 | A2 a | b c | d b | a a | b 一個表,我要選擇不同的對: A1 | A2 a | b c | d 我想: select a, b from ( select a, b , a|b as ab, b|a as ba from T )t where ab!=ba group by a, b 任何人都有一個有關我如何做到這一點的更好的

    0熱度

    1回答

    我安裝配置單元與教程: https://www.edureka.co/blog/apache-hive-installation-on-ubuntu 和其他一些。 創建數據庫,表,負載數據是更迭,但另一種是誤差的map/reduce任務 hive> create database mydb; enter code here OK Time taken: 0.366 seconds hive

    0熱度

    1回答

    我在配置單元中有一個表。的結構如下: vid varchar(2) vname varchar(10) 如果我加載下面在蜂房數據, 123,xyz 111,anc 21,pqr 只有一個記錄應插入在蜂房但所有3個記錄和截斷VID值從123到12和111到11. 任何人都可以提供任何解決方案嗎?