hive

    1熱度

    1回答

    我在AWS一個蜂房表名爲table1僅帶有一列,它看起來像圖所示: COL1 (null) active 試圖下面查詢 select * from table1 where COL1 NOT IN ('reversed') 蜂房是返回只有一行 COL1 active 爲什麼它不返回記錄(null)? 我知道修正是修改條件如下。但我想調試這個問題,以便這不會對其他查詢 wher

    0熱度

    1回答

    我想要拿出最好的HiveQL查詢來獲取行列表,其中一列將具有該節點具有的(直接)子節點的數量。數據庫是分層的,所以它看起來是這樣的: | ID | Some other column | ParentID | +-----------------------------------+ | 1 | XXXXXXXXXX x X X | NULL | | 2 | XXXXXXXXXX x X

    -2熱度

    1回答

    編寫一個SQL生成與給定條件的員工數據集的報告,如果平均年齡> 35則規定值notok數據集 id name age dept salary 1 tt 51 it 4000 2 kk 56 it 6000 3 mm 45 sales 7000 4 kk 25 sales 9000 5 op 24 hr 4000 6 op 24 hr 8000 輸出 dept avgage sta

    2熱度

    1回答

    我想用scala來訪問spark應用程序中的HIVE。 我的代碼: val hiveLocation = "hdfs://master:9000/user/hive/warehouse" val conf = new SparkConf().setAppName("SOME APP NAME").setMaster("local[*]").set("spark.sql.warehouse.dir

    0熱度

    2回答

    是不是Hive和SparkSQL不支持datetime的數據類型? 從我閱讀的參考文獻中,他們似乎只支持date和timestamp。前者不是時間分量(即小時,分鐘和秒);後者具有很高的精確度(低至毫秒),但並不是人類可讀的(它總是需要通過from_unixtime()或date_format()進行轉換,結果將是字符串,而不是datetime類型)。 相比之下,其他數據庫系統(如MySQL)具有

    0熱度

    1回答

    有人可以請幫我解決這個錯誤。由於此例外,我無法將Hive數據加載到Elastic Search。 --Hive控制檯代碼 Hive> > create external table petrol_es(distributer_id STRING,distributer_name STRING,amt_IN STRING,amy_OUT STRING,vol_IN INT,vol_OUT

    0熱度

    2回答

    我想這是很容易... 在蜂巢/ SparkSQL,我該如何轉換unix時間戳[注1]爲timestamp 數據類型? (注1:也就是說,自1970年1月1日秒/分的毫秒數) 我想from_unixtime()會做到這一點,但它給回一個字符串 ,而不是一個時間戳。以下實驗說明了該問題 步驟0:製備 select from_unixtime(1508673584) as fut; 結果:

    0熱度

    1回答

    我正在加載幾個Oracle表格到蜂巢,它似乎正在工作,但2表格正在出錯 - IllegalArgumentException: requirement failed: Decimal precision 136 exceeds max precision 38 我檢查了Oracle表格,並沒有與十進制(136)精度的列,在來源中。 這裏是spark-shell星火/ Scala代碼: val df

    0熱度

    1回答

    我的輸入包含大量的小ORC文件,我希望在一天的每一天結束,我想將數據拆分爲100MB的塊。 我的輸入和輸出都是S3和環境中使用的電子病歷, 蜂巢參數,正在設置, set hive.msck.path.validation=ignore; set hive.exec.reducers.bytes.per.reducer=256000000; SET hive.exec.dynamic.parti

    0熱度

    3回答

    如何創建一個常量列表並在查詢的WHERE子句中使用它? 例如,我有一個蜂巢查詢,在這裏我說 Select t1.Id, t1.symptom from t1 WHERE lower(symptom) NOT IN ('coughing','sneezing','xyz', etc,...) 而是不斷的重複這個漫長的症狀名單(這使得代碼非常難看)的,有沒有辦法提前定義它時間 MY