2016-01-20 61 views
0

我有一個約800K ID的向量,並且我想檢查它是否是其他兩個大向量之一的「主動」和「取消」約100萬條記錄。我怎樣才能做到這一點?顯然,循環使用800K的Ids,並在「有效」和「取消」向量中進行%檢查將花費很長時間...有更快的方法嗎?檢查大向量中的每個值是否在其他大向量中

我的目標是有名單的每一個800K的ID,如果他們是活躍或取消,並獲得somethign像下面這樣:

ID Active Cancelled 
123  1   0 
124  1   0 
... 
+0

我們可以試試'+(df1 $%%vec1中的活動%)'如果這些是字符向量,你可以使用'%chin%'' data.table' – akrun

+0

您提到您正在爲每個ID單獨循環。目前還不清楚爲什麼這是必要的。如果您可以提供預期輸出的小型可重複示例,那將會很有幫助 – akrun

回答

0

,如果你正在處理的載體,你應該給intersect功能鏡頭......基本上只是一個包裹的%in%但不過......