2011-11-21 78 views
4

我試圖在R中使用雪來運行並行作業。我已經能夠在R和雪的舊版本上運行非常類似的工作,而沒有任何問題。 R包依賴性阻止我恢復。「無法打開連接」 - R中的HPC有雪

會發生什麼:我的工作在parRapply步驟,即在第一時間節點做任何事情短報告Sys.info()的終止。錯誤消息如下:

Error in checkForRemoteErrors(val) : 
3 nodes produced errors; first error: cannot open the connection 
Calls: parRapply ... clusterApply -> staticClusterApply -> checkForRemoteErrors 

規格: [R 2.14.0,雪0.3-8,RedHat Linux企業版客戶端版本5.6。雪包上已建成R.

詳細的正確版本: 下面的代碼似乎罰款執行:

cl <- makeCluster(3) 
clusterEvalQ(cl,library(deSolve,lib="~/R/library")) 
clusterCall(cl,function() Sys.info()[c("nodename","machine")]) 

我是最終用戶,而不是一個系統管理員,但我非常渴望得到有關可能出錯的建議和見解。

回答

14

出現這種神祕的錯誤是因爲在程序執行期間請求的輸入文件實際上並不存在。每個節點都會嘗試加載這個文件然後失敗,但這隻會導致「無法打開連接」消息。

這意味着幾乎任何事情都可能導致「連接」錯誤。令人難以置信的煩人!

+0

什麼樣的輸入文件?你是從哪裏來的? –

+0

所有的R文件都是正確的。該程序會嘗試加載一個不存在的.csv文件('data < - read.table(「dataTable.csv」)') – Sarah

+0

請參閱https://stackoverflow.com/questions/16895848/results-of-工人沒有返回正確的下雪調試一些幫助調試這些問題。 – mob