Python熊貓平等地R groupby變異

2016-12-02 77 views 2 likes

所以在R當我有一個由4列組成的數據幀，稱之爲df，我想通過一個組的和產品計算比率，我可以這樣：Python熊貓平等地R groupby變異

// generate data 
df = data.frame(a=c(1,1,0,1,0),b=c(1,0,0,1,0),c=c(10,5,1,5,10),d=c(3,1,2,1,2)); 
| a b c d | 
| 1 1 10 3 | 
| 1 0 5 1 | 
| 0 0 1 2 | 
| 1 1 5 1 | 
| 0 0 10 2 | 
// compute sum product ratio 
df = df%>% group_by(a,b) %>% 
     mutate(
      ratio=c/sum(c*d) 
    ); 
| a b c d ratio | 
| 1 1 10 3 0.286 | 
| 1 1 5 1 0.143 | 
| 1 0 5 1 1  | 
| 0 0 1 2 0.045 | 
| 0 0 10 2 0.454 |

但在Python中，我得到了循環。我知道應該有比python中的原始循環更優雅的方式，任何人有任何想法？

來源

2016-12-02 asosnovsky

回答

它可以與類似的語法來完成與groupby()和apply()：

df['ratio'] = df.groupby(['a','b'], group_keys=False).apply(lambda g: g.c/(g.c * g.d).sum())

來源

2016-12-02 01:19:16 Psidom

什麼的group_keys =假達到什麼目的？ – asosnovsky

默認情況下，'groupby（）'將組列添加爲結果的額外索引，使索引與原始數據幀不同，因此不能輕鬆分配數據幀。避免添加組列，因爲只要每行具有唯一索引，鍵就可以進行分配。 – Psidom

相關問題

1. 熊貓，GROUPBY
2. 熊貓GROUPBY和
3. 熊貓：GROUPBY
4. 熊貓GROUPBY
5. 熊貓：GROUPBY
6. 熊貓.idxmin（）拋出ValueError異常與GROUPBY
7. groupby datediff在熊貓
8. 熊貓：使用GROUPBY
9. 熊貓：使用GROUPBY
10. 大熊貓從GROUPBY
11. 大熊貓與GROUPBY
12. 熊貓GROUPBY體重
13. Python的大熊貓GROUPBY /追加列
14. python（熊貓）：重組groupby語句
15. Python的大熊貓GROUPBY年月日周
16. Python的大熊貓篩選和GROUPBY
17. Python熊貓groupby datetime和多個參數
18. Python的大熊貓GROUPBY多計數
19. Python的熊貓GROUPBY重置價值
20. Python的大熊貓GROUPBY多列
21. Python的大熊貓GROUPBY行爲
22. Python的熊貓GROUPBY：根據上值
23. 熊貓GROUPBY（）變換（）MAX（）與過濾
24. 是什麼「AAPL」之間的差異，[「AAPL」]在Python大熊貓GROUPBY
25. Python熊貓地圖
26. 熊貓 - 數組groupBy結果
27. 熊貓-方式GROUPBY像itertools.groupby
28. 熊貓GROUPBY在列表
29. 熊貓，groupby絕對月份
30. 優化GROUPBY聚集熊貓