操作我也加入了與5個字段命名爲大熊貓數據幀:蟒蛇,在大的熊貓數據幀
product | price | percentil_25 | percentil_50 | percentile_75
的每一行我想上課的價格是這樣的:
如果價格低於percentil_25我給這個產品類1,依此類推
因此,我所做的是:
classe_final = OrderedDict()
classe_final['sku'] = []
classe_final['class'] = []
for index in range(len(joined)):
classe_final['sku'].append(joined.values[index][0])
if(float(joined.values[index][1]) <= float(joined.values[index][2])):
classe_final['class'].append(1)
elif(float(joined.values[index][2]) < float(joined.values[index][1]) and float(joined.values[index][1]) <= float(joined.values[index][3])):
classe_final['class'].append(2)
elif(float(joined.values[index][3]) < float(joined.values[index][1]) and float(joined.values[index][1]) <= float(joined.values[index][4])):
classe_final['class'].append(3)
else:
classe_final['class'].append(4)
但是,因爲我的DataFrame非常大,所以它會一直持續下去。
你有什麼想法我可以做得更快嗎?
對不起你只是想確定類產品的依賴,其價格落在每一個百分點?所以<25級1,> = 25和<50級2 ..... – EdChum 2014-09-19 07:50:52
是exaclty @EdChum – woshitom 2014-09-19 07:56:58
對不起,我剛剛注意到你正在使用一個有序的字典來存儲你的值,所以我的答案是不正確的,你想要什麼生產?你的代碼將產生一個以產品爲關鍵詞的詞典,然後每個類別的產品價格列表也是屬於這個詞典的,這是否正確?你可以展示一個玩具樣本數據集和預期的輸出 – EdChum 2014-09-19 08:14:23