hiveql

0熱度

2回答

我的數據是這樣的：我希望獲取與出現的小時間每dtcode的第一條記錄。所需的輸出：通過使用Scala的，我想取。請指導我構建邏輯。謝謝， Syam。

0熱度

1回答

我想獲取非現有的數據爲空使用外部爆炸蜂巢中，但我的查詢不返回任何東西。編輯：表 - 年線，companyrank year:string,topcompanies:array<struct<name:string,rank:string>> 樣本數據編輯： 2015, "topcompanies":[ {"name":"apple","rank":"1"},

0熱度

1回答

在蜂房裏，能變更託管/外部表的位置

在蜂房裏，能變更託管/外部表的位置如果是的話。改變位置後，將它表現得像外部表或內部表

-1熱度

2回答

將多個文件加載到HIVE表中

看我試圖分析太多文件到一個HIVE表中。關鍵的見解，我正在與json文件和表結構是： CREATE EXTERNAL TABLE test1 ( STATIONS ARRAY<STRING>, SCHEMESUSPENDED STRING, TIMELOAD TIMESTAMP ) ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonS

-3熱度

2回答

蜂巢表創建一個默認值

我有一個表在RDBMS像這樣： create table test (sno number, entry_date date default sysdate). 現在我想創建一個蜂巢表的結構如添加一個默認值的列。

1熱度

1回答

在Hive表上合併重複記錄

我有下表獲取增量更新。我需要編寫一個普通的Hive查詢來合併具有相同鍵值和最新值的行。 Key | A | B | C | Timestamp K1 | X | Null | Null | 2015-05-03 K1 | Null | Y | Z | 2015-05-02 K1 | Foo | Bar | Baz | 2015-05-01 想要得到的： Key | A | B | C |

-1熱度

1回答

如何總結BIGINT到時間戳蜂巢

我有兩列看起來像這樣在一個蜂巢表： Seconds_col Timestamp_col 87 2017-09-25 08:06:00.0 59 2017-09-25 08:10:00.0 我試圖創建另一個時間戳列是seconds_col + timestamp_col的總和，但我有問題搞清楚如何將類型爲BIGInt的seconds_col加入Timestamp_

0熱度

2回答

SELECT DISTINCT對列的值

我有這樣 A1 | A2 a | b c | d b | a a | b 一個表，我要選擇不同的對： A1 | A2 a | b c | d 我想： select a, b from ( select a, b , a|b as ab, b|a as ba from T )t where ab!=ba group by a, b 任何人都有一個有關我如何做到這一點的更好的

0熱度

1回答

階段1：HDFS讀取：0 HDFS寫入：0失敗

我安裝配置單元與教程： https://www.edureka.co/blog/apache-hive-installation-on-ubuntu 和其他一些。創建數據庫，表，負載數據是更迭，但另一種是誤差的map/reduce任務 hive> create database mydb; enter code here OK Time taken: 0.366 seconds hive

0熱度

1回答

Hive截斷列數據

我在配置單元中有一個表。的結構如下： vid varchar(2) vname varchar(10) 如果我加載下面在蜂房數據， 123,xyz 111,anc 21,pqr 只有一個記錄應插入在蜂房但所有3個記錄和截斷VID值從123到12和111到11. 任何人都可以提供任何解決方案嗎？