所以,我在發佈這篇文章之前回顧了大量的文章和論壇,但是我一直在閱讀衝突的答案。首先,操作系統不是問題,我可以使用Windows或Unix,無論對我的問題最好。我有大量的數據需要用於只讀目的(不知道爲什麼這很重要,但是,如果是這樣,我將不得不經歷的數據結構是一組數組哈希值的數組也是數組)。我基本上將一個「查詢」與大量不同的「句子」進行比較,並計算它們的相對相似性。從這些數量(幾百萬)中,我想獲得最高的x%,並與他們一起做些事情。我需要將這個過程並行化。對於我來說,減少空間沒有什麼好的方法 - 我需要比較一切以獲得好的結果,而且它會花費太長的時間來處理某些線程/分支。我再次看到許多相互矛盾的答案,不知道該怎麼做。Threading vs Forking(解釋我想做什麼)
任何幫助,將不勝感激。提前致謝。
編輯:我不認爲內存使用量將是一個問題,但我不知道(8 GB RAM)
的Perl吃比預期更多的內存。在你走之前,試着加載你的數據結構,看看會花多少錢,結果可能讓你感到驚訝。 – 2013-04-28 00:57:12
我在這裏沒有看到問題。 – jordanm 2013-04-28 01:16:20
問題是,我應該使用什麼:線程或分叉? – 2013-04-28 02:54:26