我對Spark有點新,我正在嘗試做一個簡單的映射。
我的數據是這樣的:獲取一個元組的第一個項目在每個列表中的每一行pyspark
RDD((0, list(tuples)), ..., (19, list(tuples))
我想要做的就是抓住每個元組的第一個項目,所以最終是這樣的:
RDD((0, list(first item of each tuple),..., (19, list(first item of each tuple))
有人能幫助我如何來映射這個?
我會感激!
啊,是的,這是完全意義上的。非常感謝@AChampion –