我們有以下情形:數據的Hadoop的map-reduce
我們的java.Currently實現我們從一個MySQL表中讀取數據,並輸出保存到另一個mysql table
map-reduce processes
鏈。現在我們可能需要來自另一個表的數據作爲映射/減少過程的輸入。
可能的解決方案:
一)要麼我們可以有輸入連接查詢映射過程或
二)我們可以做簡單的jdbc connection
連連請求數據讀取所需的數據(儘管,我不喜歡它)。
問題:
這種情況下的最佳實踐是什麼? 未來我們可能會轉移到mongoDB
。那種情況下最好的做法是什麼?
我們知道sqoop和配置單元,但它們與我們當前的場景無關。由於項目需求,我們必須使用核心地圖縮減流程。問題是如何從多個sql表中獲取mapper-reducer中的數據? – 2012-03-03 05:28:22