impala

0熱度

1回答

我最近在三節點MapR羣集上安裝了Impala。當我運行一個簡單的查詢時，性能不如Impala + HDFS。以下是查詢： SELECT * FROM ft_test, ft_wafer WHERE ft_test_parquet.id = ft_wafer_parquet.id and month = 1 and day = 8 and param = 2913; 花了大約3秒。但

0熱度

1回答

UTC在因帕拉

在因帕拉pst轉換一些我得到不正確的數據，同時從UTC轉換爲PST.When時間戳我在蜂巢上運行相同的查詢，我得到正確的數據，但在黑斑羚PST轉換是沒有做正確的一些日期。帕拉： select from_utc_timestamp('2006-08-30 08:00:00','PST') 2006-08-30 01:00:00 蜂巢： select from_utc_timestamp('2

1熱度

1回答

Neo4j的APOC程序帕拉配置

1）從執行的 https://www.cloudera.com/downloads/connectors/impala/jdbc/2-5-37.html 2）下載的驅動程序帕拉37年2月5日： call apoc.load.driver("com.cloudera.impala.jdbc4.Driver") 任何錯誤。 3）執行的： CALL apoc.load.jdbc("jdbc:impa

-1熱度

1回答

Spark SQL vs Impala對於ETL

目前，我們正在使用傳統數據倉庫ETL工具IBM DataStage。我們希望遷移這些工作。這些工作主要包括連接和轉換來派生事實表。哪種技術可以更好地遷移這些工作？我們在使用ETL的Impala查詢時使用hue oozie，我們是否應該將spark sql用於ETL而不是Impala查詢？

0熱度

1回答

如何連接到pyspark的黑斑羚？

我想在PySpark中構建一個模型。並輸入此模型形成impala.PySpark可以連接嗎？謝謝！

0熱度

1回答

Impala：選擇僅返回表2中最大（日期）但小於表1中的日期的行的數據

我的情況與下面討論的示例幾乎相同。 select data where date is max(date) less than x 我有表作爲 s_currency cdate ratio currency ------------------------------------------------------------------- 2017

1熱度

1回答

Impala SQL：合併具有重疊日期的行。 WHERE EXISTS和遞歸CTE不支持

我想合併具有重疊日期間隔的表在Impala SQL中的行。然而，我發現解決此問題的解決方案並不受Impala支持。在哪裏存在和遞歸CTE。我該如何在Impala中編寫查詢？什麼，我想實現的是 Table: @T ID StartDate EndDate 1 20170101 20170201 2 20170101 20170401 3 20170505 2

1熱度

1回答

使用直線上運行遠程斑羚一些SQL失敗

當我期運用這個命令得到了一個錯誤： $ beeline --silent=true -u 'jdbc:hive2://[ip]:21050/[database];auth=noSasl' -n 'username' -p 'password' -e 'use [database]; create table test_table (id int, name string);' Error: A

1熱度

1回答

Apache Impala和Cloudera Impala有什麼區別？

我有點困惑Apache Impala和Cloudera Impala。他們之間有什麼大的區別嗎？感謝，楊憲益葉

0熱度

1回答

如何在EMR

創建一個引導作用的黑斑羚的最新版本帕拉的，我可以從2015年找到一個EMR引導作用This one這並安裝因帕拉2.2.0 有一種簡單的方法來更新這2.7還是2.8？旋轉Ubuntu 14.04盒子來構建是一種選擇，但我不清楚如何最終將它安裝在EMR集羣上。