Fortran：32位/ 64位性能可移植性

我已經開始使用Fortran（95）生成一些數字代碼（生成python模塊）。下面是一個簡單的例子：Fortran：32位/ 64位性能可移植性

subroutine bincount (x,c,n,m) 
    implicit none 
    integer, intent(in) :: n,m 
    integer, dimension(0:n-1), intent(in) :: x 
    integer, dimension(0:m-1), intent(out) :: c 
    integer :: i 

    c = 0 
    do i = 0, n-1 
    c(x(i)) = c(x(i)) + 1 
    end do 
end

我發現，這32位有很好的表現，但在作爲x86_64的編譯是約5倍速度較慢（MacBook Pro的酷睿2，雪豹，gfortran 4.2.3從r .research.att.com）。我終於意識到這可能是由於使用32位整數類型而不是本機類型，實際上，當我用整數* 8替換時，64位性能僅比32位的性能差25％。

爲什麼在64位機器上使用32位整數慢得多？是否有任何隱含的強制轉換，我可能不知道？

對於這種類型的代碼，64位是否會比32位慢（我對此感到驚訝） - 還是有機會讓64位編譯版本運行速度相同或更快？有什麼辦法可以聲明一個（整數）變量是'原生'類型...即32位時編譯32位，64位時編譯64位現代fortran。如果沒有這個，看起來不可能編寫便攜式fortran代碼，根據編譯的代碼它不會太慢，而且我認爲這意味着我將不得不停止對我的項目使用fortran。我曾看過kind和selected_kind，但沒能找到任何這樣做。

[編輯：大性能損失是由f2py包裝複製陣列從64位INT將它轉換爲32位整型，所以沒有什麼固有的FORTRAN]

來源

2009-11-03 robince

回答你的主要問題'是選擇正確的編譯器選項，以32或64位聲明默認的整數。我從來沒有使用gfortran（我更喜歡g95，甚至更好的付費編譯器），所以我谷歌搜索，似乎-fdefault-integer-8是你需要的選項。

就像你我很驚訝，64位版本比32位版本慢。在這一點上我沒有任何亮點。

來源

2009-11-03 17:42:59

謝謝 - 我曾經找過類似的東西，但一直沒能找到它。不幸的是，它並沒有真正解決我的問題 - 我用f2py封裝子程序，當我使用該選項時，它會扼流（總線錯誤），因爲我猜f2py爲32位整數生成整數。所以如果我這樣做，我仍然必須手動編輯每個平臺的生成的接口，這是我想要避免的（只是想把它給人）。我真的很想從http://gcc.gnu.org/onlinedocs/gcc-3.4.6/g77/Kind-Notation.html那裏得到類似kind = 7的東西，但它似乎已經過時（不適用於gfortran） – robince 2009-11-03 17:59:24

我一直沒有能夠得到G95的雪豹工作，但我期待得到一個支付（英特爾） – robince 2009-11-03 18:00:30

雖然我沒有仔細研究，但我還沒有看到如此大的速度差異。

我建議嘗試更新版本的gfortran。版本4.2更早（gfortran從4.0開始）並被認爲已過時。 4.3和4.4都有很大的改進，並具有更多的功能。 4.4是目前的非beta版本。在Mac上獲取它們的簡單方法是通過MacPorts：gcc43和gcc44軟件包包含gfortran。編譯器安裝爲gcc-mp-4.3，gfortran-mp-4.3等，以免與其他版本衝突。或者你可以嘗試gfortran wiki頁面上的最新版本4.5。

英特爾fortran有時比gfortran快得多。

來源

2009-11-03 18:40:23

真的也試過使用64位來運行watfor 77但我的是完全不可能的。我有一個gf-FOR-compiler用於我的64位，並嘗試了一些選項在谷歌上使用後來給出了一個選項使用gcc-mp 4.3和gfortran 4.3。版本仍然很慢。我建議你使用32位機器，這是一個fortran壓縮運行你的程序或降級你的64位到32位來運行你的progs更快，更準確。讓我們繼續研究，以便通過WATFOR77和子例程來實現64位機器的運行。

來源

2012-12-12 06:02:06

Fortran：32位/ 64位性能可移植性

回答

相關問題