轉換numpy的陣列爲0或1

A = np.array([[0.94366988, 0.86095311, 0.88896715, 0.93630641, 0.74075403, 0.52849619 
        , 0.03094677, 0.85707681, 0.88457925, 0.67279696, 0.26601085, 0.4823794 
        , 0.74741157, 0.78575729, 0.00978911, 0.9203284, 0.02453695, 0.84884703 
        , 0.2050248, 0.03703224, 0.92931392, 0.11930532, 0.01411064, 0.7832698 
        , 0.58188015, 0.66897565, 0.75119007, 0.01323558, 0.03402649, 0.99735115 
        , 0.21031727, 0.78123225, 0.6815842, 0.46647604, 0.66323375, 0.03424828 
        , 0.08031627, 0.76570656, 0.34760863, 0.06177743, 0.6987531, 0.4106426 
        , 0.6648871, 0.02776868, 0.93053125, 0.46395717, 0.23971605, 0.9771735 
        , 0.66202407, 0.10482388]])

轉換的條目進入0（如果激活< = 0.5）或1（如果激活> 0.5）轉換numpy的陣列爲0或1

for i in range(A.shape[1]): 
if A[i]>0.5: 
    Y_prediction[i] = 1 
else: 
    Y_prediction[i] = 0

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

以及如何使用矢量化這 THX

來源

2017-08-12 Ryan Wang

'如果A [0,1]>。 0.5：' – JosefZ

np.random.seed(223) 
A = np.random.rand(1000000) 
A = [0 if i <=0.5 else 1 for i in A]

來源

2017-08-12 09:30:37 Tkanno

Thx！你能告訴我如何實現循環使用嗎？ –

這是一個列表理解，wh ich比在python中使用循環要快得多。你不需要循環來獲得結果。 @jezrael的答案也是一個好方法。 – Tkanno

@Tkanno - 我無法爲timeit添加解決方案，因爲ValueError：具有多個元素的數組的真值是不明確的。使用a.any（）或a.all（）':( – jezrael

我想你需要量化的功能np.where：

B = np.where(A > 0.5, 1, 0) 
print (B) 
[[1 1 1 1 1 1 0 1 1 1 0 0 1 1 0 1 0 1 0 0 1 0 0 1 1 1 1 0 0 1 0 1 1 0 1 0 0 
    1 0 0 1 0 1 0 1 0 0 1 1 0]]

B = np.where(A <= 0.5, 0, 1) 
print (B) 
[[1 1 1 1 1 1 0 1 1 1 0 0 1 1 0 1 0 1 0 0 1 0 0 1 1 1 1 0 0 1 0 1 1 0 1 0 0 
    1 0 0 1 0 1 0 1 0 0 1 1 0]]

但更好的是holdenweb solution如果需要轉換爲只0和1。

np.where是更好的，如果需要轉換成另一種標量像5和10或a和b：

C = np.where(A > 0.5, 5, 10) 
print (C) 
[[ 5 5 5 5 5 5 10 5 5 5 10 10 5 5 10 5 10 5 10 10 5 10 10 5 
    5 5 5 10 10 5 10 5 5 10 5 10 10 5 10 10 5 10 5 10 5 10 10 5 
    5 10]] 

D = np.where(A > 0.5, 'a', 'b') 
print (D) 
[['a' 'a' 'a' 'a' 'a' 'a' 'b' 'a' 'a' 'a' 'b' 'b' 'a' 'a' 'b' 'a' 'b' 'a' 
    'b' 'b' 'a' 'b' 'b' 'a' 'a' 'a' 'a' 'b' 'b' 'a' 'b' 'a' 'a' 'b' 'a' 'b' 
    'b' 'a' 'b' 'b' 'a' 'b' 'a' 'b' 'a' 'b' 'b' 'a' 'a' 'b']]

時序：

np.random.seed(223) 
A = np.random.rand(1,1000000) 

#jez 
In [64]: %timeit np.where(A > 0.5, 1, 0) 
100 loops, best of 3: 7.58 ms per loop 

#holdenweb 
In [65]: %timeit (A > 0.5).astype(int) 
100 loops, best of 3: 3.47 ms per loop 

#stamaimer 
In [66]: %timeit element_wise_round(A) 
1 loop, best of 3: 318 ms per loop

來源

2017-08-12 09:38:14 jezrael

好的答案。 'np.where'是我的這個方法。我更喜歡它通過廣播bools和轉換爲int，它只是更可讀的imo，並適用於其他標量和數據類型，如你所示。 – nluigi

標準numpy廣播可用於每個元素進行比較用一個標量值，爲每個元素產生一個布爾值。然後ndarray.astype方法將True值轉換爲1並將False值轉換爲零。

In [16]: (A > 0.5).astype(int) 
Out[16]: 
array([[1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 0, 1, 0, 
     0, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 
     1, 0, 0, 1, 1, 0]])

來源

2017-08-12 09:40:26 holdenweb

可以使內置的round功能單元方式使用np.vectorize。

import numpy as np 

element_wise_round = np.vectorize(round, otypes=[np.int]) 

print element_wise_round(A)

來源

2017-08-12 09:45:37 stamaimer

您的代碼的問題是代碼中A [i]的維數。 A被初始化爲矩陣[1，n]（1 row和n列 - 你在np.array（[[]]））中有double [[]]括號，所以你引用A [i]實際上意味着「整個第i行，或者在這種情況下是數組（n））我對python和numpy非常陌生，但要訪問單個單元格並將其設置爲1或0，可以用這種方式進行編碼（當然，只有當你被迫在這裏FOR循環使用）：

for i in range(A.shape[1]): 
if A[0,i]>0.5: 
    Y_prediction[0,i] = 1 
else: 
    Y_prediction[0,i] = 0

但是，絕對，最好的解決辦法，如上所述別人，是爲了避免循環

來源

2017-11-17 13:21:20

Upvoted的建議，以避免'for'循環。 – holdenweb

轉換numpy的陣列爲0或1

回答

相關問題