2017-04-26 180 views
0

我有一個multifasta文件,其中包含來自2個abinitio工具的預測蛋白質。每個序列最後都包含一個立體(*)。我想從文件中刪除它。我的序列是這樣的:從fasta文件中的fasta序列末端刪除空間(*)

>snapgene1 
SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP* 
>snapgene2 
SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP* 

我想要的序列是這樣的:

>snapgen1 
SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP 
>snapgene2 
SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP 

誰能幫我在這。三江源

回答

1

如果存儲在一個文件 「TEMP.TXT」 的文字,你可以用命令:

sed -i "s/*$//" temp.txt 
+0

它的工作。非常感謝 –

0

在awk中,如果你把你的fastas在file

$ awk '{sub(/\*$/,"")}1' file 
>snapgene1 
SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP 
>snapgene2 
SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP 

它取代尾隨*什麼也沒有。