arrayfire

    1熱度

    1回答

    我正嘗試使用arrayFire python(https://github.com/arrayfire/arrayfire-python)進行多GPU編程。 但是,當我嘗試將其與併發期貨(https://docs.python.org/3/library/concurrent.futures.html)庫連接時,我遇到了同步問題。 有沒有人有關於如何使用arrayfire-python並行處理多個

    0熱度

    1回答

    從調用一個簡單的arrayfire構造函數,我得到了Segmentation Fault。 #include <arrayfire.h> int main(){ af_array a; int N = 10; dim_t dims = 10; af_randu(&a, N, &dims, f32); af::array b(a); re

    3熱度

    1回答

    如何在af ::數組中創建一個簡單行列式? Tryed在AF使用::數組x: AF :: DET(X) DET(X) x.det() 和不工作。 有人可以幫助我嗎? error: no matching function for call to ‘det(af::array&)’ if(det(x) == 0){ candidate: template<class T> T af::

    2熱度

    1回答

    我使用arrayfire在GPU(OpenCL)的幫助下加速了一些C++代碼。我有600MB以上的af :: array,我需要沿列維翻轉,然後轉置它。 到目前爲止,我用C++例程幾乎完成了這些操作。然而,我現在想用AF做它,但注意到AF庫過多的內存使用。我有兩個問題: 1)我完全不明白爲什麼300MB陣列上的任何操作(例如翻轉或T)應該使用超過900MB的內存。 2)我想知道如何避免創建數組fo

    2熱度

    1回答

    上Acessing一個值I有AF ::陣列和需要在一排接取的值,如Z(8),例如 但是,當我嘗試用增量我要做到這一點,在一個循環中,編譯器返回 cannot convert from 'af::array::array_proxy' to 'double' 有人知道我怎麼能接取數組裏面的值? 謝謝。

    2熱度

    1回答

    假設我有一個stl::array<float, 24> foo這是一個線性化的STL掛件到一個列 - 專業格式陣列陣列,例如, af::array bar = af::array(4,3,2, 1, f32);。所以我有一個af::dim4對象dims尺寸bar,我有多達4 af::seq-對象,我有線性陣列foo。 怎樣才能明確得到foo(即bar的線性化版本)代表例如第2.nd和第3.r行,即

    0熱度

    1回答

    如何在arrayfire-python中實現行/列外部產品? 這裏是numpy的類比實現。 A = np.random.randint(1,7, size=(3,2)) B = np.random.randint(1,7, size=(2,3)) X = np.einsum('ik,kj->kij', A,B) X array([[[ 8, 16, 12], [ 8, 16,

    2熱度

    1回答

    我修改了http://www.deeplearningbook.org/contents/convnets.html中的方程9.12,以使MxN卷積核心居中。 這給出了梯度以下表達式(只要相信現在),假設1個輸入和1個輸出信道(爲了簡化): dK(krow, kcol) = sum(G(row, col) * V(row+krow-M/2, col+kcol-N/2); row, col) 要

    0熱度

    1回答

    我試着用python的arrayfire。 我有一個GTX550Ti並使用opencl後端,因爲我似乎沒有得到cuda工作(不知道550Ti的計算版本2.1是否對arrayfire來說太低)。 我嘗試釋放正在使用的語句分配如 import numpy as np import arrayfire as af arr_h = np.arange(2**15,dtype=np.complex64

    1熱度

    1回答

    我不太瞭解OpenCL,但我知道C/C++ API要求程序員將OpenCL代碼作爲字符串提供。但最近我發現ArrayFire庫不需要字符串代碼來調用一些計算。我想知道它是如何工作的(它是開源的,但代碼有點混亂)。有沒有可能像下面與OpenCL的後端調用任何一塊編譯(X86爲例)的代碼編寫並行: template <typename F> void parallel_for(int starts,