openmp

    -1熱度

    1回答

    我已經編寫了一個調用C函數的Python腳本,該腳本使用OpenMP並行化(使用ctypes-wrapper傳遞從Python到C函數的變量)。 C函數可以正確地生成所需的輸出。但是,我在Python代碼的最後得到了一個分段錯誤。我懷疑它與OpenMP產生的線程有關,因爲當OpenMP被禁用時seg-fault不會發生。 在代碼的Python端(它調用外部C-功能)我有: ... C_Func

    3熱度

    1回答

    隨着gcc 7.1的發佈,我們現在可以配置gcc for openmp 4.5,卸載到Nvidia PTX GPGPU。這就是他們在發佈說明(大約)中所說的。 所以我的問題是,是否有任何特殊的標誌來激活此配置時,編譯openmp 4.5目標nvidia設備?

    0熱度

    1回答

    我目前正試圖找到一種快速和可靠的方式來並行化一組循環,如果條件,我需要保存在內部循環的結果。代碼應該經過3D網格中的大量點。對於本卷中的某些點,我必須檢查另一個條件(檢查一個角度),如果滿足這個條件,我必須計算一個密度。 迄今爲止最快的方法是在所有for循環之外的#pragma omp parallel for private (x,y,z) collapse(3)或用於最內循環(phiInd)的

    1熱度

    1回答

    我一直在Eigen 3.2中使用ConjugateGradient解算器,並決定嘗試升級到Eigen 3.3.3,希望從新的多線程特性中受益。 不幸的是,當我使用GCC 4.8.4啓用-fopenmp時,解算器似乎較慢(〜10%)。看着xosview,我看到正在使用的所有8個CPU,但性能更慢...... 一些測試後,我發現,如果我禁用編譯器優化(使用-O0代替-O3),然後-fopenmp並加快

    0熱度

    1回答

    我想在Fedora 25上從源代碼編譯LLVM,Clang,OpenMP(來自LLVM項目)和libC++(libcxx)。默認GCC 6.3正在用於構建它們。我發出 cmake ../llvm -DCMAKE_BUILD_TYPE=Release -DLLVM_TARGETS_TO_BUILD="X86" 一切似乎順利,直到我得到 -- Performing Test LIBOMPTARGE

    5熱度

    3回答

    g++ -fopenmp main.cpp抱怨未定義的引用爲std::vector。如何解決這個問題? 我在Ubuntu上安裝了libomp-dev軟件包。 的main.cpp #include<vector> #include<iostream> template<typename T, typename A> T recursiveSumBody(std::vector<T, A> &

    0熱度

    1回答

    我正在研究使用Omp的'C'並行編程。在我的模塊陣列求和parallel.c我包括第一,作爲請求,文件hpc.h是在我的C文件相同的文件夾,幷包含以下代碼: /*This header file provides a function double hpc_gettime() that returns the elaps ed time (in seconds) since "the epoch

    0熱度

    2回答

    auto t1 = chrono::steady_clock::now(); #pragma omp parallel { for(int i=0;i<n;i++) { #pragma omp for collapse(2) for(int j=0;j<n;j++) { for(int k=0

    2熱度

    2回答

    我使用OpenMP和C工作了大學交付上,我試圖執行下面的代碼,我想要做的唯一的事情就是看每個部分在每一個不同的線程是如何工作的: #include <omp.h> #include <stdio.h> int main() { int id, np; printf("Max threads number: %d\n",omp_get_max_threads

    2熱度

    1回答

    這個問題涉及上英特爾至強E5-2650v4處理器的流三合會結果的解釋。該處理器有2個插槽,每個插槽有12個內核。每個插座上的共享L3高速緩存是30 MB,即30/12 = 2.5 MB/core。因此,在OpenMP版本的STREAM基準陣列大小= 4 * ((30+30) * 1024 * 1024)/8 = 31,457,280中的雙元素大約是32,000,000(3200萬)的雙元素。我使用