我已經在java中編寫了一個用於處理大量數據的代碼。我想將它分發到多臺機器上以處理部分數據並更快地完成處理。我之前從未從事過分佈式計算。有沒有工具可以完成這項工作?謝謝。如何在多臺機器上通過java分發程序?
回答
Gridgain工作得很好。 Hadoop是一個偉大的,但需要更多的開發。 Hazelcast coulb是一個很好的局外人
我也可以引用其他人,但是如果不知道涉及的數據類型和處理類型,很難回答你的問題。進程I/O密集型還是CPU綁定?
其中一個問題是「數據集有多大?」。
謝謝。我剛剛閱讀了Hadoop,試圖找到如何指導。我需要找到每對數據集之間的交集。因此,即使是相對較大的數據也需要很長時間。 – 2012-07-25 09:04:44
處理是CPU綁定的。 – 2012-07-25 09:32:25
自3年以來,我們在生產中使用Gridgain,並且我們發現它非常靈活且易於使用。這是CPU密集型任務 – Grooveek 2012-07-25 09:43:07
好像你想要做一個map-reduce algorithem。
Hadoop是一個開源項目,提供了一個框架來做到這一點。
- 1. 遠程ssh通過多臺機器
- 2. 運行在同一臺機器上的多個Java程序
- 3. 如何在多臺機器上羣集節點應用程序
- 4. 在多臺機器上分配狀態
- 5. 通過另一臺分機在鉻上發送請求
- 6. 通過互聯網在多臺機器上使用D-Bus
- 7. 如何通過PowerShell腳本本身在多臺機器上安裝PowerShell模塊
- 8. 如何在多個服務器上分發j2ee應用程序?
- 9. 程序員如何在多臺計算機上工作?
- 10. 如何在多臺遠程機器上運行Jython腳本?
- 11. 如何在多臺遠程機器上設置多主機網絡與docker swarm
- 12. 分發Java控制檯程序
- 13. 如何在另一臺機器上運行web應用程序?
- 14. 如何在同一臺機器上的程序之間進行通信?
- 15. 如何通過Java控制檯應用程序進行分頁執行「less」?
- 16. 位於一臺機器上或兩臺機器上的兩個進程的Java nio套接字通信
- 17. 在多臺機器上的進程之間的鎖機制
- 18. 如何將私人程序分發給100多臺設備?
- 19. 如何在多個字段上創建遠程過濾器?分機Js 5
- 20. MongoDB在一臺機器上分片
- 21. 如何在遠程機器上使用java機器人類
- 22. Java:多平臺程序的可過濾文件瀏覽器?
- 23. GDB服務器 - 如何附加多臺機器上的多個進程?
- 24. 如何通過同一臺機器上的TCP套接字在java中進行通信
- 25. 進程間通信:一臺服務器和多臺客戶機
- 26. PHP:gzdeflate在多臺機器上安全嗎?
- 27. 多臺Informatica Powercenter客戶機在同一臺機器上?
- 28. 如何讓桌面應用程序調用同一臺機器上的Java應用程序上的方法
- 29. 如何通過java連接遠程windows機器?
- 30. 通過Java應用程序發佈URL
聽起來像你正在尋找一個[hadoop](http://hadoop.apache.org/)集羣 – Joost 2012-07-25 08:43:43
我會確保你正在儘可能有效地處理數據,並且IO不是瓶頸。多臺機器提供更多的CPU和內存,但可能會使IO瓶頸變得更糟。 – 2012-07-25 09:25:07
@PeterLawrey我相信IO在我的情況下不是問題。這是需要很多時間的處理。這就是爲什麼我想分發它。謝謝 – 2012-07-25 09:33:49