我有一個包含說明列的數據框,我試圖從該列中的文本中解析出測量值。在數據框中創建新列時保留缺失值空白
df['measurements'] = [re.findall('\S+\scm', i) + re.findall('\S+cm', i) for i in df['description'] if i is not None]
#...
description列中的一些行是空的,所以上面的代碼給了我一個ValueError,因爲值的長度與索引的長度不匹配。如果該行爲空,那麼如何追加一個像NaN這樣的填充值,以便值的長度與索引的長度相匹配,並且可以創建新的度量值列?
輸出看起來類似於: 例如。
description measurements
blabla 32cm x 24cm x 12cm blabla ['32cm', '24cm', '12cm']
NaN NaN
18cm x 15cm x 10cm blablabla ['18cm', '15cm', '10cm']
NaN NaN
你可以添加一些樣本數據和期望的輸出? – jezrael
我通過樣品數據更改輸出。 – jezrael