2016-04-17 45 views
0

我有以下的熊貓數據框:重複值大熊貓據幀

 email cat class_price 
0 [email protected] cat1   1 
1 [email protected] cat2   2 
2 [email protected] cat2   4 
3 [email protected] cat2   4 
4 [email protected] cat2   1 
5 [email protected] cat1   3 
6 [email protected] cat1   2 
7 [email protected] cat2   1 
8 [email protected] cat2   4 
9 [email protected] cat2   2 
10 [email protected] cat3   1 
11 [email protected] cat1   1 

我想組通過電子郵件和class_price,每行我想借此class_price的最大值。

我使用:

test_df2 = test_df.groupby(['email','cat'])['class_price'].max() 

輸出是:

email    cat 
[email protected] cat1 2 
        cat2 4 
[email protected] cat2 2 
        cat3 1 
[email protected] cat1 3 
        cat2 4 

但我怎麼能得到一個結果,甚至分組的列保留重複的值,例如,它可以被寫成具有所有值的適當表格:

email    cat  maxvalue 
[email protected] cat2  2 
[email protected] cat1  2 
[email protected] cat3  3 

注意:示例輸出與示例輸入ju不兼容st寫的解釋這個想法。

+0

您可以添加輸入數據的輸出嗎?或者更改輸入數據以便更好地理解? – jezrael

回答