2013-04-16 35 views
0

假設我的數據是這樣的一個名爲食品列,行動和人口:我怎麼能寫的Pig Latin腳本只產生一個獨特的飲食&行動豬不同原子

pizzas eatenBy humans 
pizzas eatenBy collegeKids 
pizzas eatenBy everyOne 
pizzas grownBy farmers 
sprouts grownBy sproutFarmers 
sprouts grownBy humans 

,任何有效的人口從不同的食物&行動組?

即,我會從上述數據唯一喜歡的輸出會是這樣(雖然第一和第三線的人口可能會有所不同):

pizzas eatenBy everyOne 
pizzas grownBy farmers 
sprouts grownBy sproutFarmers 

謝謝

回答

1

唐不知道你如何用DISTINCT(這比我提出的建議更有效)做到這一點,但你可以這樣做:

food = load 'foodInput' AS (foodType,action,population); 
foodGrouped = GROUP food by (foodType,action); 
foodLimited = foreach foodGrouped { 
    limited = LIMIT food 1; 
    GENERATE FLATTEN(limited.(foodType,action,population)); 
}; 
+0

不能做到這一點,因爲選擇第三字段不清楚 – Rags