通過使用迭代和解析,我創建了一個存儲與值(與特定功能相關的統計信息)的關鍵字的Python字典。鍵,指的是一個唯一的ID(在我的情況下,一個基因)。我已通過的每一個指示一個特徵的起始點和長度元組的列表(在這種情況下,ORF或者換句話說潛在蛋白編碼序列)基因ID的填充值。任何給定的基因可以有許多這樣的特徵。一般形式是如下:通過元組字典進行解析
{key1:[(startpoint1,length1)], key2[(startpoint1,length1)(startpoint2,length2)...], key3[]}
如下圖所示(在樣品字典),有些鍵只能有一個特徵(只有一個元組對),而其他人可能有多達100或更多。爲了簡單起見,我已經展示了3對seq1。也有可能是沒有的功能和按鍵,例如,SEQ3 4.
{'seq2': [(1,6)], 'seq1': [(1, 12), (16, 9), (32,9)], 'seq3': [], 'seq4': []}
我想通過這本詞典迭代獲得「啓動點」的時候,「長」是最大的。在我的例子,答案我應該得到的是
起始點1(在SEQ1),因爲它有最大的長度值(12)所有參賽作品中。
我覺得很難迭代多個元組。
你覺得在迭代多個元組很難嗎?你是否面臨任何嘗試的問題?如果是這樣,請張貼,以及您面臨的問題 –
相關:http://stackoverflow.com/questions/5098580/implementing-argmax-in-python也注意到[最大可以採取一個可迭代和自定義函數] (https://docs.python.org/2/library/functions.html#max) – Paul