0
我有一個數據幀樣的,看起來像這樣如何通過在Python中匹配不同長度的字典中的值來替換列值?
ID Color
A red
B green
C red
D yellow
我已經通過創建一個字典中列舉的顏色成數字:
color_list = ['red', 'green', 'yellow']
colors = dict(enumerate(color_list))
現在我該怎樣與替換列值,基本顏色的ID,以使得數據幀將如下所示:
ID Color
A 1
B 2
C 1
D 3
EDIT:作爲弗洛回答問題,如果我在Spark RDD中擁有相同的數據,我將如何在Scala中處理它?