0
假設之間有2個RDDSpyspark我怎麼加兩個RDDS用相同的密鑰匹配
其中RDD1 has (key1,key2,value)
和RDD2 has (key1, value)
現在我想結合的操作(如+或減)從RDD2到RDD1集key1的地方有一個比賽 這裏例如
RDD1 has [1,1,3],[1,2,2],[2,2,5]
RDD2 = sc.parallelize([1,1])
我想導致
RDD3 to [1,1,4],[1,2,3],[2,2,5] only the first and second data was added while third one wasn't
我嘗試使用左外連接到找到key1的比賽,並做一些操作,但我會失去那些不需要做手術,有沒有辦法做到在部分數據操作中的數據?
你能澄清一下左外連接的問題嗎? –