2016-03-08 94 views
0

此問題已被問過千次問題。但是我找不到這個問題,也沒有鏈接,所以任何知道這個的人都應該幫助我。熊貓Unstack數據並寫入CSV

我有一個數據庫,我查詢數據。 獲取數據後,我將它載入熊貓。我需要的是堆疊/拆垛的數據

Data: 
user_id data_type  data_value 
    2  gender   male 
    3  age    32 
    2  work_experience None 
    5  work_experience Engineer 

如何重新排列這些數據,這樣我得到

New Data: 
user_id gender age work_experience 
    2  male '' None 
    3  ''  32  '' 
    5  ''  ''  Engineer 
  • 介意你的DATA_TYPE擁有的有效途徑30個不同的值
  • 同樣在獲得這種格式的數據時,我需要寫入csv ...這部分我認爲很容易。但我很樂意提供幫助。由於

回答

1

使用pd.pivot_table

In [644]: df 
Out[644]: 
    user_id  data_type data_value 
0  2   gender  male 
1  3    age   32 
2  2 work_experience  None 
3  5 work_experience Engineer 

In [645]: pd.pivot_table(df, index='user_id', 
    .....:    values='data_value', columns='data_type', 
    .....:    aggfunc='sum') 
Out[645]: 
data_type age gender work_experience 
user_id 
2   NaN male   None 
3   32 NaN    NaN 
5   NaN NaN  Engineer 

使用pivot_result.to_csv('file.csv')到結果存儲在CSV。