slurm

    0熱度

    2回答

    在由SLURM管理的集羣上,我想檢查當前用戶(和集羣)的隊列。通常情況下,我必須使用這個命令: squeue --user=username --clusters=clustername 這樣做的問題,除了事實,這是一個相當長的命令經常使用,是它需要的用戶名。我創建了一個腳本,在這個腳本中,我希望檢查用戶的隊列,但我必須先獲取用戶名。 我對所有這些解決方法,但是這將是巨大的,如果我可以使用如下

    0熱度

    2回答

    我嘗試在SLURM環境中使用pip安裝SciPy。 NumPy和其他一些python模塊已經安裝並正常工作。 然而,當我運行: pip2.7 install --user --use-wheel scipy 或 pip2.7 install --user scipy 我總是得到文字的一堵巨大結尾: error: Command "/sw/compiler/gcc-4.9.3/bin/gfortra

    0熱度

    1回答

    我有一個在計算集羣中運行的不平行(bash)腳本。 腳本是一個shell腳本,並且鏈接到任何MPI庫的而不是:這意味着我可以將MPI級別發送給它的唯一方式是使用命令行參數。 到目前爲止,我只有一個節點中執行它,解決方案很簡單: #!/bin/bash #SBATCH --nodes=1 N=16 seq $N | xargs -P $N -I% my_script.bash % $N 我

    1熱度

    1回答

    假設文件結構(簡體)看起來是這樣的: > some_script.py > +extra_directory/ > ++ __init__.py > ++ extra_script.py 在我的Python文件some_script.py我有一些進口看起來像這樣: from extra_directory.extra_script import extra_class 這在我的桌面上

    1熱度

    1回答

    我是SLURM的新手。我想同時處理一長串文件。具體來說,我有一個腳本來處理像 ./process.sh filename 現在我要處理很多文件列表中的文件像一個單一的 file1 file2 file3 ... file10000 如何並行處理文件列表(也就是,使用16個CPU)使用SLURM?

    2熱度

    1回答

    我有一個簡單的使用exit()的問題。 上下文正在羣集上運行一個用於並行計算的程序,所以我們安裝了一個管理和監視所有進程的Slurm系統。 問題現在,在我的程序中調用exit(1)時,SLURM似乎沒有註冊,並且CPU保持忙碌狀態,儘管程序已經終止,但仍無用地燒掉了我分配的CPU小時。 所以我問題是: 是什麼exit()什麼不同相比main()定期return 1? 有沒有簡單的方法來解決我的退出

    1熱度

    1回答

    我有以下代碼 import multiprocessing as mp import os def funct(name): if nameisvalid: do_some_stuff_and_save_a_file return 1 else: return 0 num_proc = 20 #or a call to slurm/

    0熱度

    1回答

    我有幾個關於HPC的問題。我有一個帶有串行和並行段的代碼。並行部分在不同的內存塊上工作,並且在某些時候它們可以相互通信。爲此,我在我們的集羣上使用了MPI。 SLURM是資源管理器。以下是集羣中節點的規格。 規格的節點: Processor: 2x Intel Xeon E5-2690 (totally 16 cores 32 thread) Memory : 256 GB 1600MHz EC

    1熱度

    1回答

    我已經嘗試使用MPI_Get_processor_name()和gethostname()來打印我已使用的所有節點。但它只返回第一個節點的名字!任何人都可以讓我知道什麼是問題,以及如何獲得所有節點的名稱? //testMPI.c #include <mpi.h> #include <stdio.h> int main(int argc, char** argv) { MPI_I

    0熱度

    1回答

    我正在尋找一種方法將sacct自動提供的作業信息自動保存到某個文件中。到目前爲止,我在作業批處理腳本中包含了一個sacct調用,但狀態總是「RUNNING」。 有沒有辦法在工作結束/死亡後自動調用sacct ? 我唯一想到的是提交第二份工作,然後調用sacct,但這顯然不是一個好選擇。