2017-06-19 105 views
1

我想知道什麼是最有效的方式來更新我正在使用的數據幀是。
「位置」列有一些我想要過濾的位置。我想只保留超過兩個項目的位置(>兩行以上)。 head and tail of dfsnapshot of unique locations過濾列的子集數據幀

回答

2

這可能有點複雜,但它應該完成工作。

獲得所有位置的列表超過2次出現:

counts = df['location'].value_counts() 
filt = counts[counts > 2] 

過濾原始數據,僅抽出的位置(keys())出現> 2倍

filt2 = df['location'].isin(filt.keys()) 

應用過濾器

print(df[filt2])