我是一名新的Python開發人員,並且想知道是否有人可以幫助我解決這個問題。我有一個數據集有一列描述公司類型。我注意到,例如,列中列出了手術,手術。它有眼鏡,眼鏡和驗光列表。因此,我不想在這個專欄中列出一個巨大的名單,而只是簡單地說,如果您發現一個包含「eye」,「glasses」或「opto」的單詞,那麼就將它改爲「eyewear」。我最初的代碼如下所示:簡化列表到類別
def map_company(row):
company = row['SIC_Desc']
if company in 'Surgical':
return 'Surgical'
elif company in ['Eye', 'glasses', 'opthal', 'spectacles', 'optometers']:
return 'Eyewear'
elif company in ['Cotton', 'Bandages', 'gauze', 'tape']:
return 'First Aid'
elif company in ['Dental', 'Denture']:
return 'Dental'
elif company in ['Wheelchairs', 'Walkers', 'braces', 'crutches', 'ortho']:
return 'Mobility equipments'
else:
return 'Other'
df['SIC_Desc'] = df.apply(map_company,axis=1)
這是不正確的,但因爲它是不斷變化的每一個項目爲「其他」,這麼清楚我的語法是錯誤的。有人可以幫我簡化這個專欄,我想重新標記嗎? 謝謝
已驗證將進入公司的價值? –
爲什麼不使用調試器?調試器是你的朋友,藉機學習使用一個! – donkopotamus
您還可以發佈您正在使用的數據集嗎? – WhatsYourIdea