根據另一列中的值從數據集中刪除重複項

我想根據另一列中的值從數據集中的特定列中刪除重複項。認爲這是我的數據集：根據另一列中的值從數據集中刪除重複項

我想刪除B列重複的，但根據A列事情是這樣的價值觀：

對於有A列中的值不應該是B列中存在的任何重複值。我考慮使用drop_duplicate，但我該如何灌輸其中的一個條件？

2017-09-02 Sahil

一個簡單df.drop_duplicates(subset=['A','B'])應出示您的預計產量。在這種情況下，任何同時具有與前一行相匹配的A和B的行都將被視爲重複並丟棄。

2017-09-02 09:05:40 gereleth

也許你可以使用：

df.groupby(['A'])['B'].apply(np.unique)

但該指令不返回數據幀，但這樣的事情：

A 
1 [10, 12, 13] 
2  [10, 24] 
3   [9, 10] 
Name: B, dtype: object

2017-09-02 08:38:31 Grigoriy

回答