2016-08-18 70 views
1

我是Spark的新手。我有以下RDD [數組[(字符串,字符串,字符串)]]如何合併RDD中的陣列

val r1 = sc.parallelize(Array(Array(("123","456","789"),("AAA","BBB","CCC")),Array(("DDD","EEE","FFF"),("E1","E2","E3")))) 

我想合併數組中它像

Array((123,456,789), (AAA,BBB,CCC), (DDD,EEE,FFF), (E1,E2,E3)) 

我可以r1.reduce(_ ++ _)做到這一點。但是,我想使用轉換函數,如map,而不是Actions。有可能這樣做嗎?我正在使用Spark 1.3.1。

謝謝

+0

'flatMap'可能是你在找什麼。 –

+0

謝謝。有用 :) – deadlock89

回答

3

你可以這樣做:

val res: RDD[(String, String, String)] = r1.flatMap(identity)