2013-03-24 50 views
0

我想寫的是很容易被人從SQL背景的人使用的包裝。我還沒有開始這項工作,我想知道我應該採取什麼方法。包裝在蜂巢QL/UDF的/帕拉查詢

這裏的問題陳述 - 如果有人有很多寫在他們的RDBMS數據的本地SQL,他們需要切換到Hadoop的,然後有很多的問題。 Hive已經消除了在hdfs中構建表的一個主要問題。現在到了查詢的一部分 - 這一點,我們有不同的框架,但沒有本身完整的 - 就像一個可能是緩慢的和其他可能缺乏的功能。例如,Impala有Hive QL,但最終用戶沒有ONE框架。 我打算做這樣的事情 - select(逗號分隔的字符串名稱,tableName).where(filter-expression)...

有點像Linq hdfs和它下面會找出什麼是最好的辦法執行select(蜂巢QL或黑斑羚),做一個where子句最好的辦法,等

建議?想法?批判?

感謝

回答

1

爲什麼不使用ODBCJDBC驅動帕拉?這些驅動程序由第三方工具使用,如MicroStrategy或Tableau向Impala提交查詢。