用兩個numpy向量中的元素對來填充矩陣的最快方法？

我有兩個1維numpy向量va和vb，它們被用來通過將所有對組合傳遞給函數來填充矩陣。用兩個numpy向量中的元素對來填充矩陣的最快方法？

na = len(va) 
nb = len(vb) 
D = np.zeros((na, nb)) 
for i in range(na): 
    for j in range(nb): 
     D[i, j] = foo(va[i], vb[j])

既然這樣，這段代碼需要很長的時間來運行由於以下事實：VA和VB是相對大的（4626和737）。不過，我希望這可以得到改善，因爲使用來自scipy的cdist方法執行類似的過程，並且性能非常好。

D = cdist(va, vb, metric)

我明明知道SciPy的具有運行這段代碼用C而不是蟒蛇的好處 - 但我希望有一些numpy的功能即時不知道，可以快速執行此。

來源

2014-10-31 Michael Aquilina

使用矢量化函數，它將使用Numpy的「外部」函數同時處理va和vb的所有元素...或傳遞va和vb的網格... – 2014-10-31 11:03:21

問題是此函數是自定義的，並且正在變爲矢量化是不平凡的。我嘗試使用'np.meshgrid'，然後使用'np.vectorize'，但性能改進很小。 – 2014-10-31 11:17:15

'vectorize'對你的'foo'的內部沒有任何作用。這只是一個包裝，而不是最終每個標量調用'foo（a，b）'。這是一種方便，而不是加速工具。 – hpaulj 2014-10-31 20:36:49

之一中分配內存文檔稱functional programming routines爲np.frompyfunc的最不爲人知的numpy功能。這從Python函數創建了一個numpy ufunc。沒有其他的東西可以模擬出一種numpy的ufunc，但是它是一個適當的ufunc，它具有所有的花裏胡哨的功能。雖然行爲是在很多方面非常相似，np.vectorize，它有一些獨特的優勢，有希望下面的代碼應突出：

In [2]: def f(a, b): 
    ...:  return a + b 
    ...: 

In [3]: f_vec = np.vectorize(f) 

In [4]: f_ufunc = np.frompyfunc(f, 2, 1) # 2 inputs, 1 output 

In [5]: a = np.random.rand(1000) 

In [6]: b = np.random.rand(2000) 

In [7]: %timeit np.add.outer(a, b) # a baseline for comparison 
100 loops, best of 3: 9.89 ms per loop 

In [8]: %timeit f_vec(a[:, None], b) # 50x slower than np.add 
1 loops, best of 3: 488 ms per loop 

In [9]: %timeit f_ufunc(a[:, None], b) # ~20% faster than np.vectorize... 
1 loops, best of 3: 425 ms per loop 

In [10]: %timeit f_ufunc.outer(a, b) # ...and you get to use ufunc methods 
1 loops, best of 3: 427 ms per loop

因此，儘管它仍然是明顯不如正確矢量實現，這是一個有點更快（循環是在C中，但你仍然有Python函數調用開銷）。

來源

2014-11-01 19:07:06 Jaime

這看起來像我正在尋找的，我明天會測試一下，讓你知道它是怎麼回事:) – 2014-11-02 09:42:22

cdist是快的，因爲它是寫在高度優化的C代碼（如你已經指出的那樣），和它僅支持小組預定義的metric秒。

由於您希望將該操作一般地應用於任何給定的foo函數，因此別無選擇，只能調用該函數na -times- nb次。這部分不太可能進一步優化。

剩下的要優化的是循環和索引。一些建議嘗試：

使用xrange而不是range（如果python2.x在python3，範圍已經是一個發電機等）
使用enumerate，而不是範圍+明確索引
使用蟒蛇速度「magic」，例如cython或numba，來加速循環過程。

如果您可以對foo作進一步的假設，則可以進一步加速。

來源

2014-10-31 10:20:32 shx2

像@ shx2說的，這一切都取決於什麼是foo。如果你能在numpy的ufuncs方面表達出來，然後用outer方法：

In [11]: N = 400 

In [12]: B = np.empty((N, N)) 

In [13]: x = np.random.random(N) 

In [14]: y = np.random.random(N) 

In [15]: %%timeit 
for i in range(N): 
    for j in range(N): 
    B[i, j] = x[i] - y[j] 
    ....: 
10 loops, best of 3: 87.2 ms per loop 

In [16]: %timeit A = np.subtract.outer(x, y) # <--- np.subtract is a ufunc 
1000 loops, best of 3: 294 µs per loop

否則，您可以推動循環下來用Cython水平。繼續以上一個簡單的例子：

In [45]: %%cython 
cimport cython 
@cython.boundscheck(False) 
@cython.wraparound(False) 
def foo(double[::1] x, double[::1] y, double[:, ::1] out): 
    cdef int i, j 
    for i in xrange(x.shape[0]): 
     for j in xrange(y.shape[0]): 
      out[i, j] = x[i] - y[j] 
    ....: 

In [46]: foo(x, y, B) 

In [47]: np.allclose(B, np.subtract.outer(x, y)) 
Out[47]: True 

In [48]: %timeit foo(x, y, B) 
10000 loops, best of 3: 149 µs per loop

的用Cython例如故意製造過於簡單化：在現實中，你可能要添加一些形狀/步幅檢查，你的函數等

來源

2014-10-31 14:03:51

那麼我有兩個這種代碼正在運行的情況。一個是計算兩個向量之間的jaccard距離。我知道scipy有這個功能，但是在我們的例子中，行爲略有不同。另一個是在字典中執行查找，它取決於並且需要爲你的特定設置進行測量。[D [i，j] = a.get（（va [i]，vb [j]），1.0）' – 2014-10-31 14:20:16

- 其中'％timeit'是你的朋友。如果你在途中遇到困難，最好問一個單獨的問題與細節。祝你好運！ – 2014-10-31 14:42:02

用兩個numpy向量中的元素對來填充矩陣的最快方法？

回答

相關問題