熊貓GROUPBY在列表

我有以下格式的熊貓數據幀：熊貓GROUPBY在列表

Arrival Departure Park Station Count 
     8  10 5 [1,2]  1 
     5  12 6 [3,4]  1 
     8  10 5 [1,2]  1

我想GROUPBY的到達，離開，公園，車站這個數據幀，但由於站是一個列表，我得到一個錯誤。輸出應該看起來像：

Arrival Departure Park Station Count 
     8  10 5 [1,2]  2 
     5  12 6 [3,4]  1

請問我是否有任何方法可以解決此問題？

來源

2016-09-21 user36729

你想要的輸出是什麼？ –

我想通過根據到達，出發，公園和車站對行進行分組來獲得數據幀。 – user36729

問題是，Python list is a mutable type, and hence unhashable。在groupby準則df.Station中放置的地方，請改爲df.Station.apply(tuple)。這將把列表轉換爲可哈希（和不可變）的元組。

例如：

In [66]: df = pd.DataFrame({'Arrival': [8, 5, 4], 'Station': [[1, 2], [3, 4], [1, 2]]}) 

In [67]: df.groupby([df.Arrival, df.Station.apply(tuple)]).Arrival.sum() 
Out[67]: 
Arrival Station 
4  (1, 2)  4 
5  (3, 4)  5 
8  (1, 2)  8 
Name: Arrival, dtype: int64

相反，

df.groupby([df.Arrival, df.Station]).Arrival.sum()

將無法正常工作。

來源

2016-09-21 17:38:28

它的作品，但它給了我係列。我怎樣才能讓它成爲一個數據框？ – user36729

@ user36729無論何時你有一個's'系列，並且希望把它變成一個DataFrame，你可以使用's.to_frame（）'。 –

謝謝。這樣，'到達'和'站'在數據幀的索引中粘在一起。無論如何分裂他們？ – user36729

import pandas as pd 
df = pd.DataFrame({'arrival':[8,5,8], 'departure':[10,12,10], \ 
'park':[5,6,5], 'station':[[1,2], [3,4], [1,2]]}) 

df['arrival_station'] = df.station.apply(lambda x: x[0]) 
df['departure_station'] = df.station.apply(lambda x: x[1]) 
print df 

    arrival departure park station arrival_station departure_station 
0  8   10  5 [1, 2]    1     2 
1  5   12  6 [3, 4]    3     4 
2  8   10  5 [1, 2]    1     2

現在你的車站數據是免費的，你可以像往常一樣groupby。

來源

2016-09-21 17:42:11 RoboCopNixon

熊貓GROUPBY在列表

回答

相關問題