大熊貓列值合併

2016-12-02 134 views 2 likes

我有一個這樣的熊貓數據幀：大熊貓列值合併

df = pd.DataFrame({'a1':['astr1','jmtr2','astr2','mmsk3', 
         'astr6','jmtr2','astr2','mhhk', 
         'astr5','mmsk','astr6','astr1', 
         'mstr1','mhhk','mstr2','mhhk'], 
        'a2':[x for x in np.random.randn(16)]}) 
df 

    a1  a2 
0 astr1 -0.490416 
1 jmtr2 0.651627 
2 astr2 0.784004 
3 mmsk3 -1.595870 
4 astr6 1.228631 
5 jmtr2 -1.644518 
6 astr2 -0.311709 
7 mhhk -1.284221 
8 astr5 -0.356339 
9 mmsk -0.071046 
10 astr6 1.620838 
11 astr1 -0.717384 
12 mstr1 0.830618 
13 mhhk -0.020226 
14 mstr2 -0.056465 
15 mhhk -0.160234

我想現在要做的是合併a1如果前四個字母是一樣的。同時，應該添加a2的值。

像這樣：

a1  a2 
0 astr $sum of astr$ 
1 jmtr $sum of jmtr$ 
2 mmsk $sum of mmsk$ 
3 mhhk $sum of mhhk$ 
4 mstr $sum of mstr$

來源

2016-12-02 running man

回答

我認爲你需要的a1第一4字符groupby與indexing with str和骨料sum：

print (df.a1.str[:4]) 
0  astr 
1  jmtr 
2  astr 
3  mmsk 
4  astr 
5  jmtr 
6  astr 
7  mhhk 
8  astr 
9  mmsk 
10 astr 
11 astr 
12 mstr 
13 mhhk 
14 mstr 
15 mhhk 
Name: a1, dtype: object 

print (df.a2.groupby(df.a1.str[:4]).sum().reset_index()) 
    a1  a2 
0 astr 1.112200 
1 jmtr -1.559358 
2 mhhk 1.113222 
3 mmsk -0.023918 
4 mstr -2.526466

來源

2016-12-02 12:58:27 jezrael

偉大的.. @ jezrael，你幫了我很多，THKS ... –

超級，謝謝你的問題很好的樣品，美好的一天！ – jezrael

@ runningman：不要忘記將其標記爲答案。 – mstuebner

相關問題

1. Python的大熊貓列合併
2. 大熊貓：與合併dataframes
3. 熊貓合併添加列
4. 熊貓合併列json_normalize後
5. 熊貓合併
6. 大熊貓 - 用一系列數據幀的合併值
7. 熊貓合併，並添加列
8. 合併在熊貓
9. 熊貓合併行
10. 熊貓合併列另一列
11. 用大熊貓合併很多df
12. 合併兩隻大熊貓dataframes郵票
13. 大熊貓合併不起作用
14. 把大熊貓合併WHERE子句
15. 在大熊貓合併錯誤
16. 合併兩個dataframes與大熊貓
17. 合併大熊貓據幀指數
18. 大熊貓列值的行值
19. 大熊貓上的外部合併DataFrames導致MemoryError ---如何將「大數據」與大熊貓合併？
20. 將大熊貓對象拼合到列
21. 回合大熊貓數據幀/系列
22. 大熊貓如何聚合多個列
23. 大熊貓：一列
24. 大熊貓 - 多列
25. 大熊貓陣列
26. 熊貓：連接數據幀併合並相同列的值
27. 熊貓合併產生重複列
28. 熊貓：合併兩個系列
29. 熊貓系列的垂直合併
30. 熊貓在索引列上合併？