1
例如變換RDD我有型((i,j), k)
的下一個RDD:在PySpark
((0,0), 0)
((0,1), 0)
((1,0), 0)
((1,1), 0)
我想將它轉化爲一個又一個,其中有1
如果i==j
。我的第一次嘗試出錯了:
rddnew = rdd.flatMap(lambda ((i,j), k): [if i==j: ((i,j), 1)]))
有人可以幫助我改進Python代碼?