我想從製表符分隔文件(無標題)創建兩個python3字典。該文件有2列,我想命名爲group_id和gene_id。一個組可能有多個基因,一個基因可能屬於多個組。我會用一個簡單的例子來展示我想要的。從不是1:1的製表符分隔文件創建Python字典
group_id gene_id
A a
A b
A c
A d
B a
B c
B e
我想有2點字典:
dict1 = {'A':(a,b,c,d),'B':(a,c,e)}
和
dict2 = {'a':(A,B), 'b':(A), 'c':(A,B), 'd':(A), 'e':(B)}
我想存儲在元組值的速度,因爲我的文件是2.5 GB的,我會最終得到我以後需要處理的大字典。
我知道有很多像這樣的問題,但我無法從那些處理具有鍵值對的文件中找到答案。
謝謝!
肯定。你有沒有試圖實現這一點呢?看到你的代碼會很高興,看看你有多遠以及你有什麼困難。 – idjaw
熊貓是一個開始的好地方。 –
值可以是列表而不是元組嗎? – wwii