torque

    1熱度

    1回答

    我正在編寫一個應用程序來測試pbs_connect()是否正在工作。這裏是我的代碼: #include <stdio.h> #include "/usr/include/torque/pbs_ifl.h" #include "/usr/include/torque/pbs_error.h" #include <pbs_config.h> #include "libpbs.h" in

    1熱度

    1回答

    所以,我需要將計算密集型工作(深度神經網絡訓練)提交到一個扭矩集羣,這個集羣會佔用計算時間,而且我需要每幾分鐘交換幾個大浮點數組因爲節點需要在最新版本的神經網絡上工作以訓練它。 我想知道是否有任何良好的溝通選擇,至少要告訴每個活躍的工作姐妹工作'ips,所以它可以連接到他們通過tcp。節點無法訪問互聯網,我們無法在作業提交服務器上運行守護進程。 ,我看到的唯一的選擇是: 一些消息傳遞轉矩選擇(我是

    0熱度

    1回答

    TORQUE是否在異源羣上工作? 我想用作一組舊服務器在家裏,但他們沒有相同的特徵(數量,CPU,內存等)。

    2熱度

    1回答

    默認情況下,從提交的作業到轉矩隊列的輸出將被保存到名爲job_name.o658392的文件中。使用該示例,我想要做的是將輸出文件命名爲658392.job_name.log。 我知道我可以通過在腳本的頂部寫入#PBS -e filename行來指定輸出文件的名稱,甚至可以在文件名中使用變量,例如$PBS_JOBID。 問題是,$PBS_JOBID不只是數字 - 而是它看起來像658392.som

    0熱度

    1回答

    我可以在有多個 核心的機器上使用qsub分配作業嗎? 我的機器有8個內核,可以分別在這8個內核上使用PBS服務器分配作業(不同程序集)嗎? 如果沒有,是否有任何其他此替代。當使用並行模式時,程序的主腳本使用qsub在節點上分配6個不同的作業,但是當用戶不會選擇並行選項時,它只使用一個而不是其他的核心。

    0熱度

    1回答

    我對此完全陌生。我必須使用TORQUE提交作業,並且我想運行一個生成多個文件(數百萬個)的python程序。該程序已經寫好,並且工作正常。我還寫了一個測試腳本,用於打印'Hello World'並提交它,並且它工作,生成一個名爲'Hello World'的test.numbers。我採用了相同的腳本,而不是打印某些東西,我寫了python程序的名稱(我製作了可執行文件)。然而,程序在一秒鐘內完成(

    -1熱度

    1回答

    時很慢扭矩4性能我有扭矩非常奇怪的性能問題。看看下面的循環。它需要13秒鐘來運行。但是如果我替換行 c.and(PicturePeer.ID,SimpleKey.keyFor(2072)); 與 c.and(PicturePeer.ID,2072); 同一迴路中0.2秒運行。這是沒有意義的,因爲它是完全相同的操作,這是得到圖片ID = 2072; 我甚至能在我的PostgreSQL數據庫完整的查詢

    0熱度

    1回答

    我使用的是TORQUE/MOAB/RHEL 6.7的HPC。在PBS jobscript相關線是 #PBS -l nodes=1:ppn=8,mem=12gb module load r_3.2.0 module load icc_14.0.3-ompi_1.8.3 mpirun -np 1\ --mca mtl mx --mca pml cm --bind-to core --m

    1熱度

    2回答

    我正在嘗試編寫腳本以提供有關進程的診斷信息。我已經使用qsub將腳本提交給作業計劃服務器。我可以輕鬆找到作業發送到的節點。但我希望能夠找到目前正在運行的進程。 即。我在提交的腳本中列出了不同的命令,我如何找到當前正在運行的命令以及傳遞給它的參數?在腳本 matlab -nodesktop -nosplash -r "display('here'),quit" python runsomethin

    -1熱度

    1回答

    我需要根據調度程序的類型運行不同的腳本,這需要一種可靠的方法來檢測調度程序是否是Torque,SGE或其他。就像$ SHELL告訴我正在使用哪個shell。或者像名字一樣。 我知道environmental variables這兩個系統設置,但他們不會給我一個可靠的或一個優雅的方式 - 給定env的命令。變量被命名爲相似或相同的..需要幾個ifs和buts,然後才能斷定它是哪一個。