我打算做一個項目來實現HBase中的所有聚合操作。但我不知道它的困難。我只有6個月的時間來完成這個項目。我應該繼續嗎?我打算用java來做。我知道已經有一些聚合函數。但是現在沒有INNER JOIN像查詢那樣。我打算實施這種類型的查詢。我不知道這是一個錯誤或虛張聲勢。HBase內部加入和協處理器
0
A
回答
0
HBase肯定比在RDBMS或像PIG或Hive這樣的其他Hadoop技術中做得更難。
1
我想技術上我們應該區分兩種類型的連接:
a)一個小表+一個大表。小表我的意思是表可以緩存在每個節點的內存中,而不會嚴重影響集羣操作。在這種情況下,應該可以通過在散列映射中放置小表來實現使用協處理器的連接,迭代大表的數據的節點本地部分,並且以這種方式產生連接結果。在Hive的術語中,它被稱爲「地圖」加入http://www.facebook.com/note.php?note_id=470667928919。
b)兩張大桌子。我認爲在短時間內獲得產品質量並不可行。我可能會說,這樣的功能是MPP數據庫的領域,也是他們IP的重要組成部分。
相關問題
- 1. HBase的InternalScanner和過濾協處理器
- 2. HBase 0.92是否支持協處理器二級索引?
- 3. Aerospike是否有類似HBase的協處理器?
- 4. 內存映射協處理器接口
- 5. 外部協議處理程序和現代瀏覽器
- 6. android內部和內存/處理器的限制?
- 7. 處理ISR內部的協議,以避免原子性
- 8. 處理阻力和觸摸內部onTouch
- 9. 外部和內部SQL加入
- 10. .NET批處理內部?
- 11. XSLT:處理內部XML
- 12. 處理是內部的SQL
- 13. NiFi協調器 - 處理數據
- 14. 批處理文件協議解析器
- 15. 分佈式事務處理協調器
- 16. 彙編語言協處理器
- 17. 預處理器,後處理器,幾何處理器和NC處理器
- 18. 獲取Hbase處理器過濾器行的時間戳
- 19. 標題添加內容處理「附件」導致內部服務器錯誤
- 20. Python 3多處理:內部和超時錯誤處理和回調
- 21. 錯誤處理內部或外部類?
- 22. 內部加入mysql
- 23. Mysql內部加入
- 24. MapReduce內部加入?
- 25. 內部加入和SUM的SQL更新
- 26. HQL內部加入和日期查詢
- 27. 內部加入,選擇SUM和Where
- 28. Magento內部加入和訂購
- 29. MySql內部加入和排除
- 30. SQL內部加入和子查詢