2017-05-26 58 views
0

我使用SGE任務數組功能來完成我的工作:首先讀取一個原型,然後讀取不同的數據進行計算。但是,有時讀取原型時,作業會失敗。該錯誤表明原型不存在或不完整。但我確定原型文件存在並且已完成Sun GridEngine作業陣列隨機讀取文件失敗

qsub -q HTS_QUEUE -R y -r y -S /usr/bin/perl -cwd -t 1-$nphonemes Training.pl ./Config/Config.pm.2 

以上是我的命令。

請給我一些建議。謝謝。

回答

0

我猜測原型是一些共享文件系統上的文件?

  1. 如果是這樣的情況下,一個可能性是,相關文件系統 未安裝運行作業的節點上。

  2. 另一種可能性是該文件位於網絡文件系統上,該文件系統有時會爲軟裝NFS等實例產生暫時性錯誤。如果是這種情況,並且您不能或不想修改您的代碼來處理錯誤,那麼您可以使用將例程和結果複製到節點本地存儲器和從節點本地存儲器中檢查的例程括起實際代碼並處理瞬態錯誤。然後在該副本上工作。

+0

是的,它在共享文件系統上。 – OmniKing

+0

在這種情況下,我會建議檢查作業運行的節點以確保其已安裝,並檢查使用什麼類型的掛載選項查看哪種文件系統可以生成瞬時錯誤。 –

+0

我轉而使用多處理。不管怎樣,謝謝你。 – OmniKing