-2
我的數據集看起來移動GroupBys
1
2
3
4
5
...
我有一箇中間步驟,應該做如下因素
1
1,2
1,2,3
1,2,3,4
1,2,3,4,5
....
最後計算出其平均
1
1.5
2
2.5
3
...
問題 一)有沒有辦法在python/py-spark中實現這個? b)有沒有開箱即用的方法/ api? c)我搜索這種解決方案最接近的是移動平均/滾動平均/移動組。這個操作有術語嗎?
你是什麼意思'計算它的意思'?你計算每一行的平均值嗎? (如果是的話,你已經犯了數學錯誤) – maxymoo
對不起,錯字最大 –