沿軸numpy應用與不同大小的陣列

我想應用一個函數的numpy數組的所有行，它的工作原理如果行中的列表具有相同的大小，但失敗時，只要有一個不同的大小。沿軸numpy應用與不同大小的陣列

的功能不OK

dat=np.array([['4','5','*','6','+','3','/'],['4','4','*','6','*'],['4','5','*','6','+'],['4','5','*','6','+']]) 
lout=np.apply_along_axis(parseRPN,0,dat) 

print(dat) 
print(lout)

dat=np.array([['4','5','*','6','+'],['4','4','*','6','*'],['4','5','*','6','+'],['4','5','*','6','+']]) 
lout=np.apply_along_axis(parseRPN,0,dat) 

print(dat) 
print(lout)

我是否使用R應用

from math import * 
import operator 



def parseRPN(expression,roundtointeger=False): 
    """Parses and calculates the result of a RPN expression 
     takes a list in the form of ['2','2','*'] 
     returns 4 
    """"" 

    def safe_divide(darg1, darg2): 
     ERROR_VALUE = 1. 
     # ORIGINAL ___ Here we can penalize asymptotes with the var PENALIZE_ASYMPITOTES 

     try: 
      return darg1/darg2 
     except ZeroDivisionError: 
      return ERROR_VALUE 

    function_twoargs = {'*': operator.mul, '/': safe_divide, '+': operator.add, '-': operator.sub} 
    function_onearg = {'sin': sin, 'cos': cos} 
    stack = [] 
    for val in expression: 
     result = None 
     if val in function_twoargs: 
      arg2 = stack.pop() 
      arg1 = stack.pop() 
      result = function_twoargs[val](arg1, arg2) 
     elif val in function_onearg: 
      arg = stack.pop() 
      result = function_onearg[val](arg) 
     else: 
      result = float(val) 
     stack.append(result) 

    if roundtointeger == True: 
     result=stack.pop() 
     result=round(result) 
    else: 
     result=stack.pop() 
    return result

該工作的ight工具？這裏的想法是將計算向量化爲一系列列表。

感謝

來源

2017-10-17 Jorge Canelhas

'parseRPN'是什麼樣的？ – Kyle

如果我在第一個數組上應用另一個函數（'def test（a）：return a;'）而不是'parseRPN'，它對我有用。問題可能在'parseRPN'中？ –

只是一個說明：你不會得到任何性能收益。 'apply_along_axis'不是矢量化的，非矩形數組不允許矢量化 –

您的代碼工作正常，如果你只是用map或列表理解。

map(parseRPN, dat)

我不會擔心搞清楚numpy的應用，直到你真的需要提高性能。

來源

2017-10-17 13:55:48 Kyle

映射更快然後循環的explicir？ –

一個蟒蛇大師可能會更深入地圖vs for循環，但我希望他們的表現在這種情況下幾乎是相同的。 – Kyle

有了這樣一個複雜的「行」處理，你還不如把數組作爲一個列表：

等長行，dat是一個二維字符數組：

In [138]: dat=np.array([['4','5','*','6','+'],['4','4','*','6','*'],['4','5','*' 
    ...: ,'6','+'],['4','5','*','6','+']]) 
In [139]: dat 
Out[139]: 
array([['4', '5', '*', '6', '+'], 
     ['4', '4', '*', '6', '*'], 
     ['4', '5', '*', '6', '+'], 
     ['4', '5', '*', '6', '+']], 
     dtype='<U1')

有了變化長度，所述陣列是包含一維對象類型的列表：

In [140]: dat1=np.array([['4','5','*','6','+','3','/'],['4','4','*','6','*'],['4 
    ...: ','5','*','6','+'],['4','5','*','6','+']]) 
In [141]: dat1 
Out[141]: 
array([list(['4', '5', '*', '6', '+', '3', '/']), 
     list(['4', '4', '*', '6', '*']), 
     list(['4', '5', '*', '6', '+']), 
     list(['4', '5', '*', '6', '+'])], dtype=object)

在任一種情況下，一個簡單的行迭代工作正常（map也適用，但在Py3中，您必須使用list(map(...))）。

In [142]: [parseRPN(row) for row in dat] 
Out[142]: [26.0, 96.0, 26.0, 26.0] 
In [143]: [parseRPN(row) for row in dat1] 
Out[143]: [8.666666666666666, 96.0, 26.0, 26.0]

apply_along_axis也使用這樣的迭代。當數組爲3d或更高時很好，但對於1或2d數組的行迭代它是過度的。

對於一個對象數組像dat1，frompyfunc可能有一個溫和的速度優勢：

In [144]: np.frompyfunc(parseRPN,1,1)(dat1) 
Out[144]: array([8.666666666666666, 96.0, 26.0, 26.0], dtype=object)

np.vectorize是慢，但還與對象數組

In [145]: np.vectorize(parseRPN)(dat1) 
Out[145]: array([ 8.66666667, 96.  , 26.  , 26.  ])

但它應用到2D字符數組需要使用其參數signature，這個參數更慢，更復雜。

numpy對此問題沒有幫助。這真是一個列表問題列表：

In [148]: dat=[['4','5','*','6','+'],['4','4','*','6','*'],['4','5','*','6','+'] 
    ...: ,['4','5','*','6','+']] 
In [149]: [parseRPN(row) for row in dat] 
Out[149]: [26.0, 96.0, 26.0, 26.0]

來源

2017-10-17 17:29:10 hpaulj

沿軸numpy應用與不同大小的陣列

回答

相關問題