使用熊貓創建頻率表

我有一個熊貓數據幀，其中一些值是字典的名單：使用熊貓創建頻率表

name, array_of_dict 
============= 
A, [{date: '..', "is_done": True}, {date: '..', "is_done": True}, {date: '..', "is_done": True}] 
B, [{date: '..', "is_done": True}, {date: '..', "is_done": True}, {date: '..', "is_done": True}] 
C, [{date: '..', "is_done": True}, {date: '..', "is_done": False}] 
A, [{date: '..', "is_done": False}, {date: '..', "is_done": True}] 
A, [{date: '..', "is_done": False}]

我試圖讓行的頻率is_done = True和is_done = False。

我已經第一次嘗試

print(df.groupby('name').size())

這給了我

A: 3 
B: 1 
C: 1

所以我雖然我可以使用相同的功能，找到變量的字典頻率：

print(df.groupby('array_of_dict.is_done').size())

但它不起作用。

是否可以使用字典數組中的變量進行分析？

來源

2017-08-08 Jamgreen

你能告訴你希望得到什麼？ – piRSquared

你可以做

In [1274]: pd.Series([x['is_done'] for x in df.array_of_dict for x in x]).value_counts() 
Out[1274]: 
True  8 
False 3

來源

2017-08-08 20:01:02 Zero

使用熊貓創建頻率表

回答

相關問題