2009-10-29 76 views
1
mydata = [{'date': datetime.datetime(2009, 1, 31, 0, 0), 'value': 14, 'year': u'2009'}, 
      {'date': datetime.datetime(2009, 2, 28, 0, 0), 'value': 84, 'year': u'2009'}, 
      {'date': datetime.datetime(2009, 3, 31, 0, 0), 'value': 77, 'year': u'2009'}, 
      {'date': datetime.datetime(2009, 4, 30, 0, 0), 'value': 80, 'year': u'2009'}, 
      {'date': datetime.datetime(2009, 5, 31, 0, 0), 'value': 6, 'year': u'2009'}, 
      {'date': datetime.datetime(2009, 6, 30, 0, 0), 'value': 16, 'year': u'2009'}, 
      {'date': datetime.datetime(2009, 7, 31, 0, 0), 'value': 16, 'year': u'2009'}, 
      {'date': datetime.datetime(2009, 8, 31, 0, 0), 'value': 1, 'year': u'2009'}, 
      {'date': datetime.datetime(2009, 9, 30, 0, 0), 'value': 9, 'year': u'2009'}, 
      {'date': datetime.datetime(2008, 1, 31, 0, 0), 'value': 77, 'year': u'2008'}, 
      {'date': datetime.datetime(2008, 2, 29, 0, 0), 'value': 60, 'year': u'2008'}, 
      {'date': datetime.datetime(2008, 3, 31, 0, 0), 'value': 28, 'year': u'2008'}, 
      {'date': datetime.datetime(2008, 4, 30, 0, 0), 'value': 9, 'year': u'2008'}, 
      {'date': datetime.datetime(2008, 5, 31, 0, 0), 'value': 74, 'year': u'2008'}, 
      {'date': datetime.datetime(2008, 6, 30, 0, 0), 'value': 70, 'year': u'2008'}, 
      {'date': datetime.datetime(2008, 7, 31, 0, 0), 'value': 75, 'year': u'2008'}, 
      {'date': datetime.datetime(2008, 8, 31, 0, 0), 'value': 7, 'year': u'2008'}, 
      {'date': datetime.datetime(2008, 9, 30, 0, 0), 'value': 10, 'year': u'2008'}, 
      {'date': datetime.datetime(2008, 10, 31, 0, 0), 'value': 54, 'year': u'2008'}, 
      {'date': datetime.datetime(2008, 11, 30, 0, 0), 'value': 55, 'year': u'2008'}, 
      {'date': datetime.datetime(2008, 12, 31, 0, 0), 'value': 40, 'year': u'2008'}, 
      {'date': datetime.datetime(2007, 12, 31, 0, 0), 'value': 93, 'year': u'2007'},] 

在'mydata'中,我得到了連續的每月數據列表。我寫了一些代碼將它們分組。年的分組數據

partial_req_data = dict([(k,[f for f in v]) for k,v in itertools.groupby(mydata, key=lambda x : x.get('year'))]) 

現在我還需要一些有效的代碼來填補缺失的月份,即空字典。有不好的方法來做到這一點,但我正在尋找好的。

required_data = {"2009": [{'date': datetime.datetime(2009, 1, 31, 0, 0), 'value': 14, 'year': u'2009' }, 
        {'date': datetime.datetime(2009, 2, 28, 0, 0), 'value': 84, 'year': u'2009'}, 
        {'date': datetime.datetime(2009, 3, 31, 0, 0), 'value': 77, 'year': u'2009'}, 
        {'date': datetime.datetime(2009, 4, 30, 0, 0), 'value': 80, 'year': u'2009'}, 
        {'date': datetime.datetime(2009, 5, 31, 0, 0), 'value': 6, 'year': u'2009'}, 
        {'date': datetime.datetime(2009, 6, 30, 0, 0), 'value': 16, 'year': u'2009'}, 
        {'date': datetime.datetime(2009, 7, 31, 0, 0), 'value': 16, 'year': u'2009'}, 
        {'date': datetime.datetime(2009, 8, 31, 0, 0), 'value': 1, 'year': u'2009'}, 
        {'date': datetime.datetime(2009, 9, 30, 0, 0), 'value': 9, 'year': u'2009'}, 
        {}, {}, {}], 

     "2008": [{'date': datetime.datetime(2008, 1, 31, 0, 0), 'value': 77, 'year': u'2008'}, 
        {'date': datetime.datetime(2008, 2, 29, 0, 0), 'value': 60, 'year': u'2008'}, 
        {'date': datetime.datetime(2008, 3, 31, 0, 0), 'value': 28, 'year': u'2008'}, 
        {'date': datetime.datetime(2008, 4, 30, 0, 0), 'value': 9, 'year': u'2008'}, 
        {'date': datetime.datetime(2008, 5, 31, 0, 0), 'value': 74, 'year': u'2008'}, 
        {'date': datetime.datetime(2008, 6, 30, 0, 0), 'value': 70, 'year': u'2008'}, 
        {'date': datetime.datetime(2008, 7, 31, 0, 0), 'value': 75, 'year': u'2008'}, 
        {'date': datetime.datetime(2008, 8, 31, 0, 0), 'value': 7, 'year': u'2008'}, 
        {'date': datetime.datetime(2008, 9, 30, 0, 0), 'value': 10, 'year': u'2008'}, 
        {'date': datetime.datetime(2008, 10, 31, 0, 0), 'value': 54, 'year': u'2008'}, 
        {'date': datetime.datetime(2008, 11, 30, 0, 0), 'value': 55, 'year': u'2008'}, 
        {'date': datetime.datetime(2008, 12, 31, 0, 0), 'value': 40, 'year': u'2008'},] 

     "2007": [{}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, 
        {'date': datetime.datetime(2007, 12, 31, 0, 0), 'value': 93, 'year': u'2007'}] 
     } 
+1

作爲一個無關的......您不需要代碼片段中的所有'\'字符,因爲隱含的行繼續可以在這裏工作,它看起來更乾淨,沒有'\'。 – JonahSan 2009-10-29 12:54:50

回答

6
import datetime 
from itertools import groupby 
from pprint import pprint 

required_data={} 
for k,g in groupby(mydata,key=lambda x: x.get('year')): 
    partial={} 
    for datum in g: 
     partial[datum.get('date').month]=datum  
    required_data[k]=[partial.get(m,{}) for m in range(1,13)] 
pprint(required_data) 

每一年K,partial是一個字典的鍵是幾個月。 訣竅是使用partial.get(m,{}),因爲這會在數據存在時返回數據,或者在不存在數據時返回。

+0

輝煌。讓我們看看其他人。 – simplyharsh 2009-10-29 13:04:37

+0

很好的解決方案。我會用(imho better)key = operator.itemgetter(「year」)替換key = lambda x:x.get('year') – 2009-10-29 13:33:42

+0

我必須接受這個。但我仍然樂意提供有效答案。謝謝Unutbu。 – simplyharsh 2009-10-29 14:01:52