我想從可匹配現有模式的字符串列表創建DataFrame。 這是我的代碼。Scala Spark:如何從字符串列表創建RDD並將其轉換爲DataFrame
val rowValues = List("ann", "f", "90", "world", "23456") // fails
val rowValueTuple = ("ann", "f", "90", "world", "23456") //works
val newRow = sqlContext.sparkContext.parallelize(Seq(rowValueTuple)).toDF(df.columns: _*)
val newdf = df.unionAll(newRow).show()
如果我使用字符串列表,相同的代碼將失敗。我看到區別在於rowValueTuple
創建了一個Tuple
。 由於rowValues
列表的大小動態變化,我無法手動創建Tuple*
對象。 我該怎麼做?我錯過了什麼?我如何將這個列表弄平以滿足要求?
感謝您的幫助,請。
第一個爲您提供了一列和五行的DF。第二個給你一個單行的DF,其中包含一個元組。非常不同的事情。 –