2016-12-28 64 views
0

處理需要根據未索引(?)變量進行分組並經過濾的長列表中的數據的最佳方法是什麼?字典和編程變量創建列表

我有字典的列表,看起來像這樣(有多個鍵,但這些都是相關的)

[{'bol': True, 'location': 102, 'type': 39, 'value':293.3812}, ...] 

名單很長(500K給予或採取),我需要執行若干對其進行的操作包括;按'location'過濾,按'type'分組而不知道所有類型是什麼,按'bol'分組,按'value'排序。我的最終目標是獲得一個數據集(我想.xml也許?),每個'類型'將有2個值; 'bol'的最大'值'='bol'= False組的真實組和最小值。任何關於「最好」的方式來處理這個問題的建議?

+1

聽起來像數據庫的工作。 – ThisSuitIsBlackNot

回答

3

這聽起來像是一個熊貓的工作!你知道嗎?用python進行數據分析真的非常流行http://pandas.pydata.org/

我建議看看這個框架,因爲你可以用你的數據構建一個數據框,然後你想要執行的操作是tipical數據框操作。

import pandas as pd 
df = pd.DataFrame(your_list) 
# filter bol == True only 
df = df.loc[df['bol'] == True] 
df['value'].max() 
+0

我還沒有聽說過它,但看起來正是我所需要的。謝謝! – kmdewey