數據幀示例:https://www.screencast.com/t/6bxST8Fn如何使用for循環來獲取熊貓數據框中所有列的總重複數?
我試圖找到在熊貓數據框的每列中存在多少重複記錄。我以爲我可以簡單地在下面的for循環中使用df.[column name].duplicated().sum()
代碼,但是對於duplicateated()卻得到了無效的語法錯誤。
for column in df.columns:
df[column].duplicated().sum()
我的具體目標:可能有人請告訴我什麼是正確的語法?但是,如果我的做法完全不正確,那麼for循環可以完成同樣的任務嗎?
我希望能得到以下格式輸出: 列的名稱:重複總數列
你是什麼意思通過「在每列中重複記錄?」看來你只是要求給定列中的每個值出現在該列中的次數。 – blacksite
列A列B列C 馬自達索尼戴爾 馬自達蘋果HP 豐田索尼東芝 列A有2個副本,B柱有2次重複,塔C 0 – techscolasticus
請添加*和*格式你的數據是什麼像在問題中,而不是在評論中。 – blacksite