shark-sql

    1熱度

    2回答

    運行shark 0.9.0時出現以下錯誤。螺紋 異常 「主要」 java.lang.IncompatibleClassChangeError:發現了類scala.collection.mutable.ArrayOps,但接口在shark.SharkCliDriver $。主要預期 (SharkCliDriver.scala:82) 在shark.SharkCliDriver .main(Shark

    1熱度

    1回答

    與高延遲Hive相比,Drill看起來像是一個有趣的工具,用於臨時深入查詢查詢。 似乎應該有一個體面的整合這兩個,但我找不到它。 讓我們假設今天我的所有工作都是在Hive/Shark上完成的,我怎樣才能將它與Drill整合? 我是否必須來回切換到鑽機? 我正在尋找一個類似於Shark和Hive的集成。

    0熱度

    1回答

    我試圖在EMR上使用鯊魚,我似乎無法從位置設置爲S3存儲桶的表中恢復我的分區。當我嘗試顯示我的分區時,我什麼也沒有得到。 shark> MSCK REPAIR TABLE logs ; OK Time taken: 1.79 seconds shark> SHOW PARTITIONS logs ; OK Time taken: 0.073 seconds 創建我的表像 SET hi

    0熱度

    1回答

    作爲每文檔, 「阿帕奇Spark是用於大規模數據處理的快速且一般引擎」。 「 」Shark是一個用於Hadoop數據的開源分佈式SQL查詢引擎。「 而鯊魚使用Spark作爲依賴。 我的問題是,Spark是否僅僅將HiveQL解析爲Spark作業,或者如果我們使用Shark對分析查詢進行快速響應,它會做什麼好事?

    2熱度

    1回答

    我想讓鯊魚在Cassandra上工作,所以我從Cassandra中將數據導入鯊魚並運行查詢。我使用CASH開源存儲處理程序,它似乎工作時,我在本地運行鯊魚,但在分佈模式下看起來像火花奴隸不發送輸出回到主(我看不到輸出在鯊魚殼)。

    2熱度

    2回答

    我想用python或scala來連接鯊魚服務器。但我沒有找到任何工具來做到這一點。 是否有任何庫(python或scala/java)。 感謝先進。

    0熱度

    1回答

    我試圖創建一個使用鯊魚通過執行以下命令在蜂巢metastore表: CREATE TABLE src(key int, value string); 但我總是得到: FAILED: Hive Internal Error: java.util.NoSuchElementException(null) 閱讀關於在谷歌組 - 鯊魚用戶同樣的事情,但很可惜。 我的火花的版本是0.8.1 我的鯊魚的版

    11熱度

    2回答

    當我運行我的鯊魚查詢時,內存被囤積在主內存中 這是我的最高命令結果。 紀念品:74237344k總,70080492k使用,4156852k免費,399544k緩衝 交換:4194288k總,使用480K,4193808k免費,65965904k緩存 這就算我殺不改變/停止鯊魚,火花,hadoop過程。 現在,清除緩存的唯一方法是重新啓動機器。 有沒有人遇到過這個問題?是火花/鯊魚中的一些配置問題

    2熱度

    1回答

    我試圖配置一個5節點的cassandra集羣來運行Spark/Shark來測試一些Hive查詢。 我已經安裝了Spark,Scala,Shark,並根據Amplab [在集羣上運行鯊魚] https://github.com/amplab/shark/wiki/Running-Shark-on-a-Cluster進行配置。 我能夠進入鯊魚CLI,當我嘗試創建一個外部表我的卡珊德拉的ColumnFa

    0熱度

    1回答

    我想通過Shark Java API從羣集上的Hive表進行查詢(簡單選擇)。 不過,我收到此錯誤信息: 14/01/15 17:25:54 INFO cluster.ClusterTaskSetManager: Loss was due to java.lang.NoClassDefFoundError java.lang.NoClassDefFoundError: Could not ini