impala

    0熱度

    1回答

    我最近在三節點MapR羣集上安裝了Impala。當我運行一個簡單的查詢時,性能不如Impala + HDFS。以下是查詢: SELECT * FROM ft_test, ft_wafer WHERE ft_test_parquet.id = ft_wafer_parquet.id and month = 1 and day = 8 and param = 2913; 花了大約3秒。但

    0熱度

    1回答

    在因帕拉pst轉換一些我得到不正確的數據,同時從UTC轉換爲PST.When時間戳我在蜂巢上運行相同的查詢,我得到正確的數據,但在黑斑羚PST轉換是沒有做正確的一些日期。 帕拉: select from_utc_timestamp('2006-08-30 08:00:00','PST') 2006-08-30 01:00:00 蜂巢: select from_utc_timestamp('2

    1熱度

    1回答

    1)從執行的 https://www.cloudera.com/downloads/connectors/impala/jdbc/2-5-37.html 2)下載的驅動程序帕拉3​​7年2月5日: call apoc.load.driver("com.cloudera.impala.jdbc4.Driver") 任何錯誤。 3)執行的: CALL apoc.load.jdbc("jdbc:impa

    -1熱度

    1回答

    目前,我們正在使用傳統數據倉庫ETL工具IBM DataStage。我們希望遷移這些工作。這些工作主要包括連接和轉換來派生事實表。哪種技術可以更好地遷移這些工作?我們在使用ETL的Impala查詢時使用hue oozie,我們是否應該將spark sql用於ETL而不是Impala查詢?

    0熱度

    1回答

    我想在PySpark中構建一個模型。並輸入此模型形成impala.PySpark可以連接嗎?謝謝!

    0熱度

    1回答

    我的情況與下面討論的示例幾乎相同。 select data where date is max(date) less than x 我有表作爲 s_currency cdate ratio currency ------------------------------------------------------------------- 2017

    1熱度

    1回答

    我想合併具有重疊日期間隔的表在Impala SQL中的行。然而,我發現解決此問題的解決方案並不受Impala支持。在哪裏存在和遞歸CTE。 我該如何在Impala中編寫查詢?什麼,我想實現的是 Table: @T ID StartDate EndDate 1 20170101 20170201 2 20170101 20170401 3 20170505 2

    1熱度

    1回答

    當我期運用這個命令得到了一個錯誤: $ beeline --silent=true -u 'jdbc:hive2://[ip]:21050/[database];auth=noSasl' -n 'username' -p 'password' -e 'use [database]; create table test_table (id int, name string);' Error: A

    1熱度

    1回答

    我有點困惑Apache Impala和Cloudera Impala。 他們之間有什麼大的區別嗎? 感謝, 楊憲益葉

    0熱度

    1回答

    創建一個引導作用的黑斑羚的最新版本帕拉的,我可以從2015年找到一個EMR引導作用This one這並安裝因帕拉2.2.0 有一種簡單的方法來更新這2.7還是2.8?旋轉Ubuntu 14.04盒子來構建是一種選擇,但我不清楚如何最終將它安裝在EMR集羣上。