我想知道,每個人最近買了什麼物品。假設同一個人可以購買許多物品。豬分組功能
下面是輸入詳細
kumar,2014-09-30,television
kumar,2014-07-27,smartphone
Andrew,2014-06-21,camera
Andrew,2014-05-20,car
我需要的輸出如下
kumar,2014-09-30,television
Andrew,2014-06-21,camera
我寫了一個豬腳本高達本,但在那之後我不知道如何着手,可以有人幫助我
A = LOAD 'records.txt' USING PigStorage(',') AS(name:chararray,date:chararray,item:chararray);
B = GROUP A BY name;
C = FOREACH B GENERATE group,MAX(A.date);
但我需要得到每個人最近購買的物品。我如何得到這個。如果我應用GROUP,那麼我應該只使用Pig中的聚合函數。
我如何獲得已購買的收貨物品?
是的。感謝這..看起來不錯。我會試試這個。我們也可以使用rank的概念來實現相同的邏輯 – 2014-10-01 17:19:56
這個解決方案在SQL風格上太多了,Pig不是SQL它有袋子。該解決方案將強制2個MR作業而不是1個。 – alexeipab 2014-10-02 07:32:09