考慮以下兩個data.frames在Python 3使用大熊貓創建:刪除在在python另一個data.frame確切的行和一個data.frame的行頻率3
a1 = pd.DataFrame(({'A': [1, 2, 3, 4, 5, 2, 4, 2], 'B': ['a', 'b', 'c', 'd', 'e', 'b', 'd', 'b']}))
a2 = pd.DataFrame(({'A': [1, 2, 3, 2], 'B': ['a', 'b', 'c', 'b']}))
我想刪除在A2 A1的確切行,這樣的結果應該是:
A B
4 d
5 e
4 d
2 b
注意,一排在A1 2 b爲保留在最終結果(實際上只有其中的一個被與一個取消在a2)中。有沒有在熊貓或任何其他庫中的任何內置函數來獲得這個結果?
這個術語是但不幸的是'pd.Index.difference()'不足以應付,儘管它意味着集合差異。我希望能使用像'pd.Index(a1).difference(a2)'這樣的東西,但它不能正確處理非唯一的項目。 –
約翰Zwinck我今天瞭解到'索引(a1)'。希望我完成了你的方法 – Dark