2016-03-07 77 views
0

我們使用Hive(v.1.2.1)在accumulo(v。1.7.1)表上使用「sql like」進行讀取。Hive對Accumulo推薦的設置

是否有任何特殊設置,我們可以在配置單元或某處獲得我們的性能或穩定性?

如果我們以這種方式使用配置單元,有沒有任何一點例如嘗試一些配置單元索引或諸如「hive.auto.convert.join」之類的設置,或者它的工作方式不同並且在這些情況下不會影響?

謝謝!

回答

0

強制性:我寫了(大部分)AccumuloStorageHandler,但我絕不是Hive專家。

您可能會發現的最大收穫是,您可以通過可以修剪行空間的方式來構造查詢(通過WHERE子句中的rowid映射列上的語句) 。據我所知,沒有太多(任何?)查詢優化被推入Accumulo本身。

根據您的工作量,您可以使用Hive在Accumulo中生成自己的「索引表」。如果您可以創建一個自定義表格,並且您想要主動查詢存儲在Accumulo行中的列,那麼您的查詢應該運行得更快。