2016-07-07 149 views
0

假設我們有兩個數組Array1(1,2,3)和Array2(4,5,6)。 我想將它們結合到一個新的Array3((1,4),(2,5),(3,6)) 當我在Spark中嘗試時,它變成了。如何在Spark中將兩個數組併入數組中?

代碼

val data1 = Array(1, 2, 3, 4, 5) 
val data2 = Array(2, 3, 4, 5, 6) 
val distData1 = sc.parallelize(data1) 
val distData2 = sc.parallelize(data2) 

val distData3 = distData1 ++ distData2 
distData3.foreach(println) 

輸出

1 
2 
3 
4 
5 
6 

我怎樣才能正確地結合起來呢?

//更新*

在我的程序(與示例不同)。我想label.zip(功能)。我的功能是功能:Array [String]和我的標籤也是Array [String]。爲什麼它不起作用?

<console>:98: error: type mismatch; 
found : org.apache.spark.rdd.RDD[Array[String]] 
required: scala.collection.GenIterable[?] 
+0

你在乎發佈確切的代碼嗎?此代碼不正確。你不能做distData3.foreach(println)並得到一個輸出。 – eliasah

回答

0

您可以data1.zip(data2),但如果發行版不同,它將不起作用。

相關問題