2017-06-05 87 views
1

我需要一個迭代器遍歷我的JSON對象中的所有葉子。所以我寫了這個功能如何在新的迭代器中產生迭代器中的元素?

rec = {'a': {'b': [{'c': {'d': [{'e': 'x1','f': 'x2'}],'g': 'x3'}}],'h': 'x4','i': 'x5','j': [{'k': 'x6'}],'l': [{'m': {'n': 'x7'}}]}} 

def yield_leaves(rec, lbl = ''): 
    if isinstance(rec, dict): 
    for key, value in rec.items(): 
     for to_yield in yield_leaves(value, key): 
      yield to_yield 
    if isinstance(rec, list): 
    for value in rec: 
     for to_yield in yield_leaves(value, lbl): 
      yield to_yield 
    if isinstance(rec, (int, str)): 
    for entry in rec.split(): 
     yield entry, lbl 

print(list(yield_leaves(rec))) 
>>> [('x5', 'i'), ('x4', 'h'), ('x1', 'e'), ('x2', 'f'), ('x3', 'g'), ('x6', 'k'), ('x7', 'n')] 

但我覺得有些代碼是多餘的。以下行

for to_yield in yield_leaves(value, key): 
     yield to_yield 

它遍歷一個迭代,並返回值作爲一個迭代的一部分。

你知道更有效的方法來編碼嗎?

+2

從yield_leaves(value,key)'yield 3 on Python 3 –

回答

1

你的最後一節

if isinstance(rec, (int, str)): 
    for entry in rec.split(): 
     yield entry, lbl 

是有點怪。如果recint,它會崩潰,因爲整數沒有.split方法。而且你的字符串都不包含空格,所以在它們上調用.split將返回一個包含單個項目的列表:原始字符串。我想你的真實數據可能包含你想要分割的多字字符串,但如果是這樣,你真的需要從int s分開處理。

因此,假設你不是有你想拆分的多字值,我簡化了你的代碼。正如你所看到的,我只保留了dictlist測試中,由於數據是從JSON解碼,任何其他類型的rec將是某種形式的標量:intstrbool,或None,(除非你已經創建一個自定義解碼),並且我們可以相同地處理所有這些標量類型。

rec = { 
    'a': { 
     'b': [ 
      { 
       'c': { 
        'd': [{'e': 'x1', 'f': 'x2'}], 
        'g': 'x3' 
       } 
      } 
     ], 
     'h': 'x4', 
     'i': 'x5', 
     'j': [{'k': 'x6'}], 
     'l': [{'m': {'n': 'x7'}}] 
    } 
} 

def yield_leaves(rec, lbl=''): 
    if isinstance(rec, dict): 
     for key, value in rec.items(): 
      yield from yield_leaves(value, key) 
    elif isinstance(rec, list): 
     for value in rec: 
      yield from yield_leaves(value, lbl) 
    else: 
     yield rec, lbl 

print(list(yield_leaves(rec))) 

輸出

[('x1', 'e'), ('x2', 'f'), ('x3', 'g'), ('x4', 'h'), ('x5', 'i'), ('x6', 'k'), ('x7', 'n')] 

該代碼使用Python 3特徵yield from;如果你不使用Python 3,你應該。 :)

+0

是的,''''''產量'''做我想要的。謝謝。 –

+0

關於在整數上調用split,你是對的。不好的複製粘貼在我身邊 –

+0

@RobRomijnders不用擔心。如果我的回答對你有幫助,請考慮[接受](http://meta.stackexchange.com/a/5235)。 –

1

嘗試使用從收益率而不是爲

yeild from yield_leaves(value, key) 

附:如果您正在使用python> 3.3

+0

是的,'''yield from'''完成任務! –