2017-08-05 218 views
1

一個數據幀我有這樣一個數據幀有重複的值,如何刪除整列,如果一個特定的行Python中

df, 

     Name City 
    0 sri  chennai 
    1 pedhci pune 
    2 bahra pune 

有在城市列重複。

我想:

df["City"].drop_duplicates() 

,但它僅給出特定列。

我的期望輸出應該是

output_df 
     Name City 
    0 sri  chennai 
    1 pedhci pune 
+0

有沒有第1行可能被刪除而不是第2行的情況? –

回答

0

您可以使用:

df2 = df.drop_duplicates(subset='City') 

,如果你希望將結果存儲在一個新的數據幀,或:

df.drop_duplicates(subset='City',inplace=True) 

,如果你想更新df

這產生:

>>> df 
     City Name 
0 chennai  sri 
1  pune pedhci 
2  pune bahra 
>>> df.drop_duplicates(subset='City') 
     City Name 
0 chennai  sri 
1  pune pedhci 

這將因此僅採取City重複考慮在內,在Name重複被忽略。

+0

我想我需要閱讀更多文檔 – pyd

相關問題