2014-12-04 63 views
0

我有一個有14列的數據框,我想用同一列對一個數據框進行子集合,但只保留重複的行(例如,我有一個ID變量,如果ID = 2,所以我重複它的子集)。 首先,我施加到我的數據幀,看看ID在R中指定一個子集

head(sort(table(call.dat$IMSI), decreasing = TRUE), 100) 

的頻率在我的情況,重複兩個時間;所以我想看看這個ID的兩個觀察。 之後,我做了x <- subset(call.dat, IMSI == "20801170106338")hsb6 <- call.dat[call.dat$IMSI == "20801170106338", ],但結果是錯誤的(對於x,它返回了0觀察14個變量,對於hsb6,我的數據框中只有NA)。

你能幫助我,謝謝。

PS:IMSI是一個數字值。 和x <- subset(call.dat, Handset.Manufacturer == "LG")是另一個完美的例子...

+0

對不起,所有的命令都不起作用,因爲我的IMSI ...(IMSI錯了) – 2014-12-04 12:54:40

回答

0

你可以使用重複的,這是一個函數給你一個真正的數組,如果記錄是重複的。

isDuplicated <- duplicated(call.dat$IMSI) 

然後,您可以提取包含重複值的所有行。

call.dat.duplicated <- all.dat[isDuplicated, ]