我有一個有兩列的熊貓數據框。使用df.column.str.contains並更新熊貓數據幀列
df= pd.DataFrame({"C": ['this is orange','this is apple','this is pear','this is plum','this is orange'], "D": [0,0,0,0,0]})
我希望能夠讀取此C列並返回D列中水果的名稱。所以我的思考過程是使用df.C.str.contains來確定是否某個字符串出現在C的每一行,然後D相應更新.C中的元素可能是真正的長字符串:例如。 「這是紅色的蘋果」,但我只在乎蘋果這個詞出現在細胞中。我應該注意到,我並不想使用str.contains,但這似乎是最明顯的道路。只是不知道我會如何應用它。
最後的數據幀的樣子:
df= pd.DataFrame({"C": ['this is orange','this is apple','this is pear','this is plum','this is orange'], "D": ['orange','apple','pear','plum','grapefruit']})
如果這完全改變了問題我理解並會重新要求,但如果果被括號和無空格包裹什麼?相反,它可能是這樣的(橙色)。我只想返回橙色這個詞。 – John
您可以使用df.C.str.extract('this is \(?([A-Za-z] +)\ s?。*?')來處理水果周圍的括號的可能性。案例 – Vaishali
並感謝您接受:) – Vaishali