numba

2熱度

2回答

似乎在numba中不受支持。在nopython模式下使用numba.jit動態增長數組的最佳方式是什麼？到目前爲止，我能做的最好的事情是定義並調整jitted函數之外的數組的大小，是否有更好的（和更整齊的）選項？

-1熱度

1回答

GPU上計算得到錯誤的結果（python3.5 + numba + CUDA8.0）

我想獲得數組的不同部分的總和。我運行我的代碼。並從打印的內容中發現兩個問題。 PRO1：詳細介紹here。它已經解決了。也許這不是一個真正的問題。 PRO2：在我的代碼，我紅粉不同的值SBUF [0,2]，SBUF [1,2]，SBUF [2,2]和SBUF [0,3]，SBUF [1,3]，sbuf [2,3]。但是發現在cuda.syncthreads()之後，sbuf [0,2]和s

1熱度

1回答

Numba中Python列表的基本問題;這是怎麼回事？

我是Numba的初學者。對於我的生活，我無法得到一個Numba函數來操縱一個簡單的列表。哎呀，我甚至不知道如何指定簽名。下面是這個例子。怎麼了？（什麼是「反射清單」？）我該如何解決？ from numba import * from numba.types import * @jit(List(int64)(List(int64)), nopython=True) def foo(a

1熱度

1回答

是什麼導致Numba的AttributeError：'NoneType'對象沒有屬性'pysig'？

當我嘗試運行此代碼： from numba import njit, int64 from numba.types import List @njit(int64(List(int64, True))) def f(a): a[0] = 0 return a[0] @njit(List(int64)()) def g(): return [f([0])] 我得

0熱度

1回答

如何在GPU中計算對數（python3.5 + numba + CUDA8.0）

我在GPU中用math.log計算對數，這是Supported Python features in CUDA Python之一。但失敗了。我的代碼： import os,sys,time,math import pandas as pd import numpy as np from numba import cuda, float32 import os bpg = (3,1

1熱度

1回答

如何在不完全破壞性能的情況下修改Numba中的列表？

下面是一個例子。如果你運行這段代碼，將打印，它花了約1秒的量級上調用foo： import timeit import numba @numba.njit('void(List(intp, True))') def foo(v): v[0] += 1 a = range(1 << 25) start = timeit.default_timer() foo(a) stop = t

2熱度

1回答

如何指定使用自定義類型在numba中的方法的函數簽名

我使用numba.jitclass修飾器來標記我的類以進行優化。我不知道如何指定我想要優化的run方法的簽名。該方法以ConvertedDocument對象數組作爲參數。看來，numba不能因爲出現以下錯誤找出自身的數組類型，當我嘗試調用在nopython模式下的運行方式： Traceback (most recent call last): File "numba_test.py",

1熱度

1回答

可以在numpy.max（numpy.abs（a-b））上使用Cython/Numba編譯函數嗎？

我正在優化我的代碼的瓶頸部分 - 迭代函數a'= f（a），其中a和a'是N乘1的向量，直到max（abs（a' - a））足夠小。我已經把對F（A）一Numba包裝，並得到了最優化的純NumPy的版本，我能夠produe一個不錯的加速（切運行約50％）。我試着寫numpy.max的C-兼容版本（numpy.abs（aprime - 一）），但事實證明這是慢！我實際上失去了我從Numba獲得的

3熱度

2回答

與numba

我想實現的Jaccard距離的使用Python Numba @nb.jit() def nbjaccard(seq1, seq2): set1, set2 = set(seq1), set(seq2) return 1 - len(set1 & set2)/float(len(set1 | set2)) def jaccard(seq1, seq2): set1

0熱度

1回答

計算矩陣向量乘法與CUDA蟒蛇

我試圖用numbapro寫下面一個簡單的矩陣向量乘法： from numbapro import cuda from numba import * import numpy as np import math from timeit import default_timer as time m = 100000 n = 100 @cuda.jit('void(f4[:,:], f