2017-09-17 162 views
1

我正在使用HPC羣集。我成功創建了本地openmpi_gpu模塊(使用intel17.2和cuda 8.0編譯)。我所做的是,存儲cuda_17.2.lua文件目錄刪除本地lmod模塊或更新HPC羣集上的本地lmod模塊列表

${HOME}/modulefiles/Core/openmpi_gpu/ 

並經過

module use $HOME/modulefiles/Core 

我可以通過鍵入module avail看到新的模塊「openmpi_gpu/cuda_17.2」。

現在,我打算刪除此模塊,並將其替換爲使用intel 17.2而不使用cuda/8.0編譯的新openmpi。所以我rm -rf openmpi_gpu刪除openmpi_gpu的源文件,並用intel 17.2重新編譯一個openmpi。然後我刪除目錄${HOME}/modulefiles/Core/openmpi_gpu/,並創建一個新目錄${HOME}/modulefiles/Core/openmpi_intel/來存儲新的.lua文件local_17.2.lua

但是,現在我嘗試了module avail,但仍然可以看到舊模塊「openmpi_gpu/cuda_17.2」,並且看不到新模塊「openmpi/local_17.2」。

我懷疑我不應該刪除該模塊只是通過刪除源文件,或者我應該做一些事情來更新模塊列表。無論如何,有沒有人有任何關於這個問題的想法?先謝謝你。

回答

0

Lmod使用cache,因此您可能只是看到緩存並且尚未更新。運行以下命令重置密碼:

rm -rf ~/.lmod.d/.cache 

或者,你可以使用--ignore_cache選項:

module --ignore_cache avail