2017-02-09 54 views
1

後,我有一個數據幀,看起來像這樣:分配港定居人士重複每行第一次出現

crop1 crop4  crop5  crop6 crop7 crop8   crop9 crop10  crop11 
1 Onion Rice Soya Beans Sugar Cane Onion  Tea Corn (Maize) Rice Soya Beans 
2 None None  None  None None None   None None  None 
3 None None  None  None None None   None None  None 
4 Accacia Rubber  Accacia  Rubber Accacia Rubber  Accacia Rubber  Accacia 
5 Accacia Rubber  Accacia  Rubber Accacia Rubber  Accacia Rubber  Accacia 
6 Rice Rice  Rice  Rice Rice Rice   Rice Rice  Rice 

現在,我想分配港定居人士都重複條目每一行中,他們第一次發生了。也就是說,我的數據框應該在每一行中只有唯一的條目,否則NA。例如,在第一行中我想有:

1 Onion Rice Soya Beans Sugar Cane NA Tea Corn (Maize) NA NA 

爲「洋蔥」,「米」和「播大豆」在此行中已經發生。因此,第4行應該看起來像這樣:

4 Accacia Rubber NA NA NA NA NA NA NA 

對此有何看法?

謝謝!

數據框:http://pastebin.com/yKqhWyvW

回答

1

我們可以使用duplicated通過遍歷行與apply

df1[] <- t(apply(df1, 1, FUN = function(x) replace(x, duplicated(x), NA))) 
設置各行中的重複元素作爲 NA
相關問題