我在文件夾中有幾千個文件。每個文件的內容如下所示。我在這個例子中的文件名是:AAB08704.1.fasta將文件中的多行合併到單行文件中跳過標題
>gi|1117824|gb|AAB08704.1| ecdysteroid regulated 16 kDa [Manduca sexta]
MLFYITVTVLLVSAQAKFYTDCGSKLATVQSVGVSGWPENARECVLKRNSNVTISIDFSPTTDVSAITTE
VHGVIMSLPVPFPCRSPDACKDNGLTCPIKAGVVANYKTTLPVLKSYPKVSVDVKWELKKDEEDLVCILI
PARIH
我想跳過第一行,然後將餘下線合併成一條線。我所有的文件都以「>」開頭,這是標題信息,以下幾行是我想合併成一行的序列信息。
我試圖
sed -i '2,$s/\n//g' AAB08704.1.fasta
我甚至嘗試多FASTA轉換爲單行FASTA使用:
awk '/^>/ {printf("\n%s\n",$0);next; } { printf("%s",$0);} END {printf("\n");}' < AAB08704.1.fasta
這兩個命令沒有做什麼,我的期望。任何線索?
預期輸出:
>gi|1117824|gb|AAB08704.1| ecdysteroid regulated 16 kDa [Manduca sexta]
MLFYITVTVLLVSAQAKFYTDCGSKLATVQSVGVSGWPENARECVLKRNSNVTISIDFSPTTDVSAITTEVHGVIMSLPVPCRSPDACKDNGLTCPIKAGVVANYKTTLPVLKSYPKVSVDVKWELKKDEEDLVCILIPARIH
貓-A AAB08704.1.fasta給出了這樣的:
M-oM-;M-?>gi|1117824|gb|AAB08704.1| ecdysteroid regulated 16 kDa [Manduca sexta]^M$
MLFYITVTVLLVSAQAKFYTDCGSKLATVQSVGVSGWPENARECVLKRNSNVTISIDFSPTTDVSAITTE^M$
VHGVIMSLPVPFPCRSPDACKDNGLTCPIKAGVVANYKTTLPVLKSYPKVSVDVKWELKKDEEDLVCILI^M$
現在又增加了我的預期輸出。 – biobudhan