2017-08-08 102 views
0

我有一個熊貓數據幀,其中一些值是字典的名單:使用熊貓創建頻率表

name, array_of_dict 
============= 
A, [{date: '..', "is_done": True}, {date: '..', "is_done": True}, {date: '..', "is_done": True}] 
B, [{date: '..', "is_done": True}, {date: '..', "is_done": True}, {date: '..', "is_done": True}] 
C, [{date: '..', "is_done": True}, {date: '..', "is_done": False}] 
A, [{date: '..', "is_done": False}, {date: '..', "is_done": True}] 
A, [{date: '..', "is_done": False}] 

我試圖讓行的頻率is_done = Trueis_done = False

我已經第一次嘗試

print(df.groupby('name').size()) 

這給了我

A: 3 
B: 1 
C: 1 

所以我雖然我可以使用相同的功能,找到變量的字典頻率:

print(df.groupby('array_of_dict.is_done').size()) 

但它不起作用。

是否可以使用字典數組中的變量進行分析?

+0

你能告訴你希望得到什麼? – piRSquared

回答

0

你可以做

In [1274]: pd.Series([x['is_done'] for x in df.array_of_dict for x in x]).value_counts() 
Out[1274]: 
True  8 
False 3