0
可能這個問題太籠統了,但我完全停留在這個。任何類型的幫助理解:從連接的fasta文件中,如何找到每個蛋白質序列中的個別位置範圍
我有一個蛋白FASTA文件(protein.txt)像:
>a
mnspq
>b
rstuvw
>c
mnqa
注意,A,B和C蛋白的長度是5,6和4分別(總長度= 15)
我現在已經提取的一些隨機範圍(計算是基於總長度),並將其保存(FILE1.TXT)爲:
2-3
4-10
11-14
每種蛋白的長度(總內長度)作爲蛋白質文件中看到保存在另一個文件(FILE2.TXT)爲:
a 1-5
b 6-11
c 12-15
從文件1的值
現在,我要修改的文件2的值,並嘗試計算單個範圍爲每一個蛋白質序列,對於上述輸入,輸出將是:
a 2-3,4-5
b 1-5, 6
c 2-5
換句話說,如果我第一串聯我所有的序列和derermine從連結文件的一些範圍,我怎麼能找到的每一個蛋白質序列中的位置個體範圍
謝謝
不是它應該是'c 1-3'嗎? – choroba
upps ..我的錯..你是絕對正確的先生.. –