我有這樣一個數據幀:從數據框中刪除重複的行,但保持一個列列表 - Python的
file:
| FIRST | LAST | ID |
---------------------------
0 "ABC" 12 35
1 "ABC" 14 35
2 "AB" 15 36
現在,我要的是:
file:
| FIRST | LAST | ID |
---------------------------
0 "ABC" [12,14] 35
2 "AB" 15 36
對於這個問題,讓我們假設如果ID兩行相等,則除LAST之外的所有值也相等。
因此,將所有除最後一個值以外的值都添加到列表中。
我試着用在這個環節給出解決方案: Pandas DataFrame - Combining one column's values with same index into list
我用這個:
file = file.groupby('ID')
file = file['Last'].unique()
這是我得到的輸出:
ID
35 [12, 14]
36 [15]
Name: Last, dtype: object
也許,我失去了一些東西在groupby()中。
感謝提前:)
UPDATE:
我原來的數據幀有100個多列。 如果ID的兩行是相等的,那麼除了LAST之外的所有值也是相等的。
這對我來說很好。謝謝 –
如果我想使用多列的groupby()會怎麼樣? –
請參閱上面的修改。 – Alexander