我試圖將數組中取得的列名傳遞給spark sql,但不知道如何將它作爲變量傳遞。 我創建了一個數據框,並獲取變量x中的所有列,現在我創建了一個foreach循環來創建一個查詢字符串,以在下一步中查詢。 我們如何解決這個問題?最終結果應該是「dftable」中各個列的總和。請幫忙。傳遞foreach變量來觸發sql來計算Spark中的總和
df.createOrReplaceTempView(「dftable」)
// collect an array of columns
val x= df.schema.fieldNames
// create query string for the columns fetched above
x.foreach { y => "select sum(x) from dftable」}
// pass variable to query in spark.sql
spark.sql("select y from dftable」)
由於香卡和T您的回覆。問題是我想通過spark sql來實現它,因爲它將以表格格式對齊數據,但不像上面展示的Shankar那樣水平。我會保持這個問題的開放。任何幫助是極大的讚賞。 – sabby
@sabby請看我的回答:) –
T.Gaweda你真棒!棒極了!就像我想要的那樣!一個問題,如何限制這隻適用於整數列...我們可以添加數據類型相關的限制? – sabby