pgi-accelerator

    0熱度

    1回答

    使用以下虛擬代碼來複制問題。 program pp implicit none real*8,dimension(45) :: refPoints refPoints(:) = (/ -1.0 , 1.0 , 1.0 , -1.0 , -1.0 , 1.0 , 1.0 , -1.0 , 0.0 , 1.0 , 0.0 , -1.0 , 0.0 , 1.0 , 0.0

    1熱度

    1回答

    啓用OpenACC的-PGI庫之前,我問關於建立一個靜態庫與PGI的問題,並將其鏈接到一個內建GCC程序:c - Linking a PGI OpenACC-enabled library with gcc 現在,我有同樣的問題,但動態。我怎樣才能用gcc構建一個程序,而我的庫是用PGI動態構建的? 而且也考慮到以下事實: 我想他們都承認同OpenMP的編譯和程序太多。例如,當我在庫中使用Open

    0熱度

    1回答

    使用以下代碼,它是否正確?我有2GB的Geforce 750M和使用PGI Fortran編譯器。該程序工作正常4000x4000陣列,任何更高的抱怨,即使它不應該,你可以看到我已經分配9000x9000數組,但如果我使用n值> 4000它抱怨並引發運行時錯誤。 program matrix_multiply !use openacc implicit none intege

    0熱度

    1回答

    如何通過PGI編譯器找到用於OpenACC的特定函數的簽名? 例如,__pgi_uacc_enter或__pgi_uacc_launch功能。 是否有任何文檔或頭文件來查找簽名。甚至一些文件不僅關於他們的簽名,而且關於他們的功能。

    0熱度

    1回答

    我試圖編譯一個子程序FORTRAN爲$ ACC常規SEQ 我收到以下錯誤消息 /scratch/tmp/pgaccKU0jSWcDesiI.gpu(93)!錯誤:標識符 「pgf90_mzero8」 是 「/scratch/tmp/pgnvdgV0jsxZLyFWv.nv0」 的編譯 PGI編譯器版本17.4 文本情況下檢測未定義 1錯誤 子程序XX(ndime,pgaus,YY) $!ACC常規

    1熱度

    1回答

    我試圖安裝PGI編譯器2016和運行install文件 後,我得到一個錯誤: binary operator expected 就行了: if test -d $DIR/install_components ; then ShellCheck.net說「加雙引號以防止通配和分詞「無論如何。 但整個安裝套件是相當大的,所以我應該在的地方數不勝數添加引號或者是有一些命令我可以使用去走一走呢?

    0熱度

    1回答

    電話PGI運行時不支持的功能 - !pgf90_copy_f77_argl_i8 我相信我傳遞一個8字節的整數參數澳元ACC程序。 任何解決方法或在此更新? PGI編譯器17.4 示例。 type some integer(4),pointer :: xx(:) integer(4),pointer :: yy(:) end type type(some), pointer :: dat

    0熱度

    1回答

    我想運行一個簡單的測試用例,其中動態分配的數組A被定義爲extern並使用OpenACC上傳到GPU。全部使用PGI編譯器。 我header.h文件: extern int *A; #pragma acc declare create(A) 然後,我header.c實現: int *A; #pragma acc declare copyin(A) 然後,在main.c

    1熱度

    1回答

    我有一個簡單的CUDA代碼,我翻譯成OpenACC。我的所有內核都按預期進行了並行處理,並且它們與我的CUDA內核具有相似的性能。但是,設備到主機的內存傳輸殺死了我的性能。在我的CUDA代碼中,我使用固定內存,性能更好。不幸的是,在OpenACC中,我不知道如何利用固定內存。我在文檔中找不到任何東西。有人能給我提供一個簡單的OpenACC示例,它使用固定內存嗎? PS:我使用PGI 16.10-0

    1熱度

    2回答

    我很難用AMD Radeon R7 M360進行編譯。我已經編譯了多核心,如下所示,但任何人都可以告訴我如何使用GPU進行編譯,我試過了-ta = amd64/radeon,但沒有一個可行。你可以在這個圖像中看到代碼。:我 PGC++ -V -Minfo =加速度-acc -TA =多核sum.cpp -o /家庭/ fawad /桌面/總和 主要編譯它 7, Generating Multico