2016-05-23 61 views
0
  • Apache Drill的侷限性是什麼?
  • 與Apache hive/impala相比,它失敗了嗎?

回答

3

我在鑽從整體來看,

一個Apache的鑽頭的主要優點是可以跨多個數據庫查詢。你只需要配置源碼&直接查詢它們。這是Apache演練的最大優勢。 (檢查參考2)

我不能稱之爲限制,但因爲它像一個查詢引擎只需要使用calcite查詢引擎的sql查詢解析&執行查詢在節點上。它不會處理查詢執行的失敗/取消。你的應用程序需要照顧這一點。

由於其不斷髮展的版本,它有許多限制。

  1. 有沒有太多的聚合函數就像oracle/mySql例如。 MINUS,DECODE,TO_TIMESTAMP(非常小),最大,最小,
  2. 即使在用戶定義的函數上,它也可以做到最小的事情。
  3. 沒有分級查詢支持
  4. 它不能讀取XML數據(僅適用於JSON,CSV,實木複合地板..)
  5. 沒有一個單排子查詢支持(通過事先在Oracle連接)。
  6. 加入限制
  7. 它沒有模式,因此可能會造成一些混淆。

Apache Drill仍然是一個不斷髮展的版本& Drill的下一個版本將支持所有問題/限制。

希望它有幫助。

參考文獻:

  1. https://issues.apache.org/jira/browse/DRILL/?selectedTab=com.atlassian.jira.jira-projects-plugin:summary-panel
  2. http://allegro.tech/2015/06/fast-data-hackathon.html
  3. https://drill.apache.org/docs/compiling-drill-from-source/
  4. https://drill.apache.org/docs/nested-data-limitations/
  5. http://www.dbta.com/BigDataQuarterly/Articles/The-Importance-of-Apache-Drill-to-the-Big-Data-Ecosystem-103000.aspx
  6. https://www.mapr.com/blog/top-10-reasons-using-apache-drill-now-part-mapr-distribution-including-hadoop