-3
假設我們有一個包含三列(客戶ID,操作和操作時間)的數據集。在不減少行數的情況下在火花上執行max()操作
1, ACTION_1, 100
1, ACTION_2, 101
1, ACTION_3, 102
2, ACTION_1, 100
2, ACTION_2, 105
2, ACTION_3, 102
3, ACTION_1, 120
3, ACTION_2, 111
3, ACTION_3, 103
我們要同時過濾像ACTION_2一些具體的行動來獲得每個客戶的最後一個動作的時間。如下所示:
1, ACTION_2, 102
2, ACTION_2, 105
3, ACTION_2, 120
我們期待了解此問題的任何類型的解決方案。
你嘗試過什麼嗎? – mtoto
如果我們試圖獲取最後一個動作時間,我們會丟失我們想要的動作數據,在我們的例子中就是ACTION_2。 – Oguz
因此,只需爲每個客戶獲取最後一個「操作時間」並創建一個「ACTION_2」值的新列 –