我通過大量參數組合(20-40k)模擬合理大小的數據集(10-20mb)。通過mclapply
推送每個數據集x參數集,結果爲list
,其中每個項目包含輸出數據(如列表項目1)以及用於生成列表項目2(其中該列表的每個元素都是參數)的參數。什麼是存儲由R生成的大型結果的理想格式?
我剛剛跑過一個81K列表(但必須以30k塊運行它們),結果列表每個大約700 MB。我將它們存儲爲.rdata
文件,但可能會將它們重新保存到.Rda
。但每個文件需要永久讀入R
。這裏是否有最佳做法,特別是對於長期儲存?
理想情況下,我會將所有內容保存在一個列表中,但mclapply
會拋出關於無法序列化向量的錯誤,以及這個大型作業會永久佔用集羣(分裂3種方式,花費3個小時/作業)。但有幾個結果文件results1a.rdata
,results2b.rdata
,results3c.rdata
也似乎效率低下。
另一種選擇是'saveRDS',它可以讓你用不同的名字恢復對象。 – mnel