我在解決以下問題時遇到問題。 基本上我想找到哪個日期的特定項目(item_code
)被出售的最大和最小量。在火花數據幀中彙總多個列
輸入數據幀
item_code, sold_date, price, volume
101, 10-12-2017, 20, 500
101, 11-12-2017, 20, 400
201, 10-12-2017, 50, 200
201, 13-12-2017, 51, 300
預計輸出
查找max
和min
體積出售date.I希望這個解決方案,而無需使用任何lambda
操作。
df.groupBy("item_code")agg(min("volume"),max("volume"))
上面的人會幫助我獲得max
和體積min
,但我希望他們有各自的日期。
我用udf試過了我最好的級別,但是我無法破解它。任何幫助高度讚賞。
請嘗試發佈文本樣品而不是圖像。謝謝。 – philantrovert
Thanks.Updated my post @philantrovert – BDR
它din幫助我。我想要在哪個sold_date,給定item_code的最大/最小音量。 first()將相同的日期返回給我的所有結果。 – BDR