我有一個數據集,看起來像熊貓將貿易數據集轉換爲長格式的最有效方法?
tradeid buyer seller quantity
1 John Mark 10
2 Frank John 5
3 John Jesse 4
,其中基本上每一行對應一個買方和賣方之間的貿易。例如,在第一行中,我們看到約翰(買方)從馬克(賣方)那裏購買了10件貨物。
我想以每行對應的方式將數據集轉換爲交易者,以及此交易者買入或賣出的相應總數量。也就是說
output
trader totalbuy totalsell
John 14 5
Frank 5 0
Jesse 0 4
Mark 0 10
我使用熊貓的最後一個版本,並且包含大量數據。上面的轉換最有效的方法是什麼?
非常感謝!
數據框:
import pandas as pd
from io import StringIO
datastring = StringIO("""\
tradeid buyer seller quantity
1 John Mark 10
2 Frank John 5
3 John Jesse 4
""")
df = pd.read_table(datastring, sep='\s\s+', engine='python')
非常簡單,功能強大。謝謝阿美! –
@Noobie不客氣。這是一個非常強大的圖書館。 –
btw爲什麼你在groupby之後重置和設置索引?不會groupby自動創建一個索引? –