2016-06-28 89 views
5

我有我的程序減少到下面的例子分段錯誤:爲什麼MPI_Barrier導致C++

#include <mpi.h> 

int main(int argc, char * argv[]) { 
    int rank, size; 

    MPI_Init(&argc, &argv); 
    MPI_Comm_rank(MPI_COMM_WORLD, &rank); 
    MPI_Comm_size(MPI_COMM_WORLD, &size); 
    MPI_Barrier(MPI_COMM_WORLD); 
    MPI_Finalize(); 
    return 0; 
} 

我編譯和運行代碼,並得到以下結果:

My-MacBook-Pro-2:xCode_TrapSim user$ mpicxx -g -O0 -Wall barrierTest.cpp -o barrierTestExec 
My-MacBook-Pro-2:xCode_TrapSim user$ mpiexec -n 2 ./barrierTestExec 

================================================================================== = 
= BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES 
= PID 21633 RUNNING AT My-MacBook-Pro-2.local 
= EXIT CODE: 11 
= CLEANING UP REMAINING PROCESSES 
= YOU CAN IGNORE THE BELOW CLEANUP MESSAGES 
=================================================================================== 
YOUR APPLICATION TERMINATED WITH THE EXIT STRING: Segmentation fault: 11 (signal 11) 
This typically refers to a problem with your application. 
Please see the FAQ page for debugging suggestions 

如果我註釋掉了MPI_Barrier,或者只在一個節點上運行程序,代碼運行良好。我使用了以下編譯:

My-MacBook-Pro-2:xCode_TrapSim user$ mpiexec --version 
HYDRA build details: 
Version:         3.2 
Release Date:       Wed Nov 11 22:06:48 CST 2015 
CC:        clang  
CXX:        clang++  
F77:        /usr/local/bin/gfortran 
F90:        /usr/local/bin/gfortran 
Configure options:      '--disable-option-checking' '--prefix=/usr/local/Cellar/mpich/3.2_1' '--disable-dependency-tracking' '--disable-silent-rules' '--mandir=/usr/local/Cellar/mpich/3.2_1/share/man' 'CC=clang' 'CXX=clang++' 'FC=/usr/local/bin/gfortran' 'F77=/usr/local/bin/gfortran' '--cache-file=/dev/null' '--srcdir=.' 'CFLAGS= -O2' 'LDFLAGS=' 'LIBS=-lpthread ' 'CPPFLAGS= -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/mpl/include -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/mpl/include -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/openpa/src -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/openpa/src -D_REENTRANT -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/mpi/romio/include' 
Process Manager:       pmi 
Launchers available:      ssh rsh fork slurm ll lsf sge manual persist 
Topology libraries available:   hwloc 
Resource management kernels available: user slurm ll lsf sge pbs cobalt 
Checkpointing libraries available:  
Demux engines available:     poll select 


My-MacBook-Pro-2:xCode_TrapSim user$ clang --version 
Apple LLVM version 7.3.0 (clang-703.0.31) 
Target: x86_64-apple-darwin15.5.0 
Thread model: posix 
InstalledDir:  /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin 

這似乎是它應該是一個很重要的問題,但我似乎無法弄清楚。爲什麼MPI_Barrier會導致這個簡單的代碼發生故障?

+0

我無法複製。您的代碼在這裏運行時不會崩潰。 – amaurea

+0

我並不感到驚訝,這是MPI的一個簡單的例子,但是無論我有什麼編譯器組合或什麼都不合作。我只是希望有人可能以前見過這個。 – jboss

+0

歡迎來到SO。雖然你的問題被問及,但仍難以重現,從而理解你的問題。可能的答案是*您的MPI安裝有問題*,但這不是太有用。你可以添加一些關於你如何安裝MPI的細節?最終向包提供商提供的錯誤報告(假設它來自存儲庫)可能會更有前途。 – Zulan

回答

0

很難決定你的安裝有什麼問題。不過,如果你可以使用任何MPI口味,也許你可以試試這個:

http://www.owsiak.org/?p=3492

我只能說,它的工作原理與Open MPI

~/opt/usr/local/bin/mpicxx -g -O0 -Wall barrierTestExec.cpp -o barrierTestExec 
~/opt/usr/local/bin/mpiexec -n 2 ./barrierTestExec 

和也不例外我案件。它確實似乎是環境特定的。

相關問題