2016-07-31 73 views

回答

1

Charm ++和Adaptive MPI爲可用處理器集隨着時間的推移而動態縮小和擴展的「可延展」作業提供支持,無論是因爲硬件故障還是由於某些原因用戶想要在不同數量的內核上運行。這可能有兩個基本原因:

1)編程模型基於將工作分解爲邏輯實體(任務)而不是物理(處理器)。

2)運行時系統負責位置管理,並可以在執行過程中遷移所有任務及其數據。

關鍵是縮小/擴展作業就像從運行時系統的角度看動態負載平衡一樣。因此,一旦您編寫了一個能夠進行動態負載平衡的Charm ++程序,您就可以利用可鍛工作和自動檢查點/重啓支持。有關此功能的示例,請參閱Charm ++源代碼的主線中的examples/charm ++/shrink_expand /。

+0

請在答案中至少提供一個最簡單的例子,而不僅僅是對外部資源的鏈接或引用 – junkfoodjunkie

+0

如果這些節點意外丟棄網絡,您還應該提及Charm ++的容錯支持。 – Novelocrat