斯卡拉是否自己做任何事情？

我有一點創建迷宮的程序。它使用了大量的集合（默認變量，它是不可變的，或者至少用作不可變的）。斯卡拉是否自己做任何事情？

該程序計算30個尺寸增加的迷宮。使用理解（1至30）

由於使用最新版本的並行集合框架成爲可用我認爲給它一個旋轉，希望獲得一些性能。

這種失敗，並且當我調查一點，我發現了以下：

當沒有任何東西的任何調用遠程運行平行它仍顯示出對每一個4芯的約30％的處理器負載我的機器。
當我用（1到30）.par替換範圍1到30時，CPU負載在所有內核（我預期）上升到約80％。迷宮完成的順序變得或多或少是隨機的（我預期）。所有迷宮的總時間保持不變。
用它們的平行計數器部件替換一些內部使用的集合似乎有效果。

我現在有2個問題：

爲什麼我有所有4個內核紡紗，雖然沒有任何在並行運行。
無論是否平行運行，程序仍然可能會同時運行的可能原因是什麼？有沒有其他明顯的瓶頸，但CPU週期（沒有IO，沒有網絡，充足的內存通過-Xmx設置）

在這個任何想法？

來源

2011-06-07 Jens Schauder

您應該製作一個不超過一頁並編譯的例子。否則，這只是太多的猜測。垃圾收集器是唯一可以在沒有做任何事情的情況下同時運行的東西。你的程序是否創建了很多對象，在創建後立即收集垃圾？這在功能性編程風格中是相當常見的...... – 2011-06-07 19:54:13

是的，我猜想會創建很多對象，所以GC可能是一個很好的候選對象。我將激活一些日誌記錄並查看它出來的內容。 – 2011-06-07 20:17:03

我看起來我沒有得到任何性能提升，因爲我在等待GC – 2011-06-09 13:52:46

30％的核心版本只是一個糟糕的調度程序（聽起來像Windows 7），非常頻繁地將進程從核心遷移到核心。它可能更接近每個核心25％（1/4）的工藝加上其他負載30％。如果你在Linux下運行相同的例子，你可能會看到一個核心掛鉤。

當您轉換爲(1 to 30).par時，您真的開始在所有內核中使用線程，但分配如此少量工作的同步開銷然後收集結果取消了並行增益。你需要將你的工作分解成更大的獨立塊。

編輯：如果1..30中的每一個表示一些更大的工作量（解決迷宮，比方說），那麼如果每個工作單元大致相同，則自動並行化將更好地工作。想象一下你有29個簡單的迷宮和一個非常非常硬的迷宮。第30個迷宮仍將連續（或非常接近）與其他一切運行）。如果你的迷宮數量增加的複雜性嘗試產生他們的順序30 to 1 by -1，使最大的任務將首先。把它看作是解決揹包問題的智慧解決方案。

來源

2011-06-07 19:52:27

它是Windows 7.不知道我是否會找到一個Linux來測試您的理論。較大的迷宮（20號以上）需要1秒或更多。所以小塊理論似乎不適用。 – 2011-06-07 20:15:25

斯卡拉是否自己做任何事情？

回答

相關問題