2017-09-02 90 views
1

我想根據另一列中的值從數據集中的特定列中刪除重複項。認爲這是我的數據集:根據另一列中的值從數據集中刪除重複項

A B 
1 10 
1 10 
1 12 
1 13 
2 10 
2 24 
2 10 
3 9 
3 10 
3 9 

我想刪除B列重複的,但根據A列事情是這樣的價值觀:

A B 
1 10 
1 12 
1 13 
2 10 
2 24 
3 9 
3 10 

對於有A列中的值不應該是B列中存在的任何重複值。我考慮使用drop_duplicate,但我該如何灌輸其中的一個條件?

回答

0

一個簡單df.drop_duplicates(subset=['A','B'])應出示您的預計產量。在這種情況下,任何同時具有與前一行相匹配的A和B的行都將被視爲重複並丟棄。

0

也許你可以使用:

df.groupby(['A'])['B'].apply(np.unique) 

但該指令不返回數據幀,但這樣的事情:

A 
1 [10, 12, 13] 
2  [10, 24] 
3   [9, 10] 
Name: B, dtype: object 
相關問題