2016-01-06 73 views
0

pythonpanda,我怎樣才能輸出彙總統計到一個數據框沒有一個變量組?如何輸出不帶變量組的彙總統計信息?

這是我的數據集 「表1」:

email   Total_Orders Amount 
    [email protected] 5    150 
    [email protected]  
    [email protected] 4    69 
    [email protected] 2    30 

我所需的輸出是:

num_emails total_purchasers total_orders total amount 
    4   3     11    249  

如果我有一個變量 「按組」,這是我會怎麼做 -

Table2 = DataFrame(Table1.groupby(['category']).agg({'emails': 'count', 'total_orders': 'count', 'total_orders': np.sum, 'Amount': np.sum})).reset_index() 

但我沒有一個變量組,所以我該怎麼做?

回答

1

正如您所觀察到的,您不能使用groupby(),因爲沒有密鑰。相反,剛剛聚集的一切:

pd.DataFrame({'num_emails':[Table1.email.count()], 
       'total_purchasers':[Table1.Total_Orders.count()], 
       'total_orders':[np.sum(Table1.Total_Orders)], 
       'total_amount':[np.sum(Table1.Amount)]}) 

這裏的結果:

num_emails total_amount total_orders total_purchasers 
0   4   249   11     3