2016-09-07 78 views
2

我有一個數據幀填寫NaN值

TIMESTAMP P_ACT_KW PERIODE_TARIF P_SOUSCR 
2016-01-01 00:00:00 116 HC 250 
2016-01-01 00:10:00 121 HC 250 
2016-01-01 00:20:00 121 NaN 250 

要使用此數據框,我必須通過基於此條件(HC或HP),以填補NaN值:

If (hour extracted from TIMESTAMP is in {0,1,2, 3, 4, 5, 22, 23} 

所以我代替NaN by HC, 其他由HP提供。 我做了這樣的功能:

def prep_data(data): 
    data['PERIODE_TARIF']=np.where(data['PERIODE_TARIF']in (0, 1,2, 3, 4, 5, 22, 23),'HC','HP') 
    return data 

但我得到這個錯誤:

ValueError        Traceback (most recent call last) 
<ipython-input-23-c1fb7e3d7b82> in <module>() 
----> 1 prep_data(df_energy2) 

<ipython-input-22-04bd325f91cd> in prep_data(data) 
     1 # Nettoyage des données 
     2 def prep_data(data): 
----> 3  data['PERIODE_TARIF']=np.where(data['PERIODE_TARIF']in (0, 1),'HC','HP') 
     4  return data 

C:\Users\Demonstrator\Anaconda3\lib\site-packages\pandas\core\generic.py 
in __nonzero__(self) 
    890   raise ValueError("The truth value of a {0} is ambiguous. " 
    891       "Use a.empty, a.bool(), a.item(), a.any() or a.all()." 
--> 892       .format(self.__class__.__name__)) 
    893 
    894  __bool__ = __nonzero__ 

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all(). 

我該如何解決這個問題?

回答

2

使用isin來測試成員:

data['PERIODE_TARIF']=np.where(data['PERIODE_TARIF'].isin([0, 1,2, 3, 4, 5, 22, 23]),'HC','HP') 

in不理解,因爲它變得模糊,如果你的陣列因此錯誤

中有超過1 True如何評價布爾值的數組
+0

謝謝,另一個錯誤: TypeError:'method'對象不是可訂閱的 – Poisson

+1

對不起,遺失'()'arg周圍,請參閱更新 – EdChum

+0

好的,謝謝,它的工作:) – Poisson