2012-03-08 72 views
2

我想用openMPI設置一個相對較小的集羣(36個內核),並且遇到了一個小問題。我已經安裝了所有openMPI庫和任何依賴項並且運行正常(我可以在每臺計算機上運行hello world MPI程序作爲本地主機)。問題是,我似乎無法找到關於如何讓計算機一起執行程序的太多文檔。我可以執行mpirun --hostfile命令,但我不想每次執行作業時都必須指定主機文件。另外,未來的用戶無法一直訪問羣集上的所有IP地址。他們和我希望能夠執行mpirun -np 20 programFile,沒有任何問題。有人可以提供一些指導我需要做什麼從這一點?公平地說,我只在大學裏上過一門課,在那裏我們編寫了與MPI並行的程序,但他們從來沒有向我們展示如何用openMPI建立一個新的集羣。我很欣賞你們可以提供的任何建議。我通過我的搜索MPICH_Cluster_Setup發現了這個指南,如果它是openMPI,那將會很棒。那裏是否有與openMPI有關的類似指南?openMPI主節點設置配置

回答

1

您應該使用像Torque,SLURM或SGE這樣的集羣調度程序(全部是免費的/ FOSS)。這些允許用戶保留節點供其使用,並且所有的「談話」都可以打開MPI以告知它用於該用戶作業的節點(以便它們不必使用主機文件)。

根據MPICH集羣設置文檔,它只是關於您打開MPI所需的內容,但不需要在最後設置MPD(無論如何,MPICH都已棄用MPD)。