2016-01-22 51 views
2

我爲我的學校項目建立了一個Rocks Cluster,它是矩陣乘法,其中一個前端和5個其他計算機是節點。通過MPI,我向他們發送用於乘法的矩陣的部分,然後他們發回數據。我運行命令:如何查看岩石羣上節點的詳細工作?

mpirun -hostfile myhostfile ./myprogram 

其中myhostfile是節點及其插槽(線程)數量的名稱的文件。 我的程序正在運行,現在我正試圖對其進行分析。

我的問題是我如何看待每個節點核心/處理器工作在他的任務上,所有處理器的工作,是否有某種過載? 我試圖安裝Vampir Profiler和Intels Vtune Amplifierbut但是我有一些問題將它們附加到我的程序上面的這個命令(其他的命令不允許我在一個節點的所有線程上運行我的程序)。我所完成的所有工作(看看我的節點除了Ganglia之外還能工作)是從前端登錄到一個節點,並使用命令「top」來查看我的程序何時執行的線程數和幾乎100%的CPU使用率在每個線程上。

+0

你可以給我們一些關於MPI實施細節的細節嗎?而且,你還在尋找一些內存佔用的細節? –

+0

您好naveen-m,我正在尋找類似的東西,只是爲了看看節點自己的詳細工作,內存使用情況和核心上的CPU使用情況,這裏是我使用的代碼[鏈接](https:// www。 daniweb.com/programming/software-development/code/334470/matrix-multiplication-using-mpi-parallel-programming-approach) – warkovich

+0

您是否有機會嘗試其他配置文件?我建議使用Allinea(滴滴涕)或TAU。 Allinea有30項試驗,它應該直接進行配置和使用... Allinea可以提供最佳的使用記憶足跡細節。 TAU也是一個類似的工具,具有幾乎相似的屬性。 https://www.cs.uoregon.edu/research/tau/about.php –

回答

1

看看mpstat的

由於沒有PARAMS它會顯示聚合負載的所有核心

mpstat -P ALL顯示負載每個核心

這會給你的節點的實時統計:

watch pdsh -w compute-01-[01-10] mpstat 

(使用您的計算節點名稱)