0
我有一個數據幀,我希望得到一個列的平均值。如果我得到這樣的:設置均值/平均列的一個變量
avg_NoPItems = df.groupBy().mean('NoPItems').collect()
後來我不能使用,因爲我得到一個數據幀的對象與任何值進行比較。那麼,我怎樣才能得到數字的意思不是數據框?
PD:我曾試過,但不起作用:
avg_NoPItems = df.groupBy().mean('NoPItems').collect()[0]
爲什麼你通過使用一組,我想你可以簡單地選擇(平均( 「NoPItems」):df.select(平均( 「NoPItems」)作爲(「意思「))。first.getAs [Double](」mean「) – Mehrez
我不能使用它,pyspark用'.... as(」mean「))表示無效的sintaxis ...' –
抱歉,我沒有使用Scala中,爲蟒蛇,我認爲是(但不知道):'df.select(平均( 「NoPItems」)別名( 「中庸」)。)第[ 「的意思是」]' – Mehrez