0
我想寫的是很容易被人從SQL背景的人使用的包裝。我還沒有開始這項工作,我想知道我應該採取什麼方法。包裝在蜂巢QL/UDF的/帕拉查詢
這裏的問題陳述 - 如果有人有很多寫在他們的RDBMS數據的本地SQL,他們需要切換到Hadoop的,然後有很多的問題。 Hive已經消除了在hdfs中構建表的一個主要問題。現在到了查詢的一部分 - 這一點,我們有不同的框架,但沒有本身完整的 - 就像一個可能是緩慢的和其他可能缺乏的功能。例如,Impala有Hive QL,但最終用戶沒有ONE框架。 我打算做這樣的事情 - select(逗號分隔的字符串名稱,tableName).where(filter-expression)...
有點像Linq hdfs和它下面會找出什麼是最好的辦法執行select(蜂巢QL或黑斑羚),做一個where子句最好的辦法,等
建議?想法?批判?
感謝