2012-04-18 94 views
5

我已經使用熊貓數據框聚合數據。以下是顯示的一些實際數據以及我如何彙總它。大熊貓聚合數據到一個numpy數組:數據結構轉換

fdf.groupby(['row',col'])['percent'].sum()

http://pastebin.com/R8XWpgtU

我想這樣做是創建這個(行=行,列= COL)的2D numpy的陣列。任何光滑的方式來做到這一點?

另一種方式我做了類似的事情是創建數據透視表

pivot_table(fdf,values='percent',rows='row',cols='col', aggfunc=np.sum)

在這種情況下,我想轉換此數據透視表到2d numpy的陣列。有沒有辦法讓我索引到這張表的每個單元格。如果是這樣的話,我可能會對桌子本身好。

回答

6

嘗試:

result = fdf.groupby(['row',col'])['percent'].sum() 
result.unstack('col').values 

或者:

fdf.pivot_table('percent', rows='row', cols='col', aggfunc='sum').values