2017-10-17 70 views
0

下方的行我有一個大文件,像這樣的小例子:修改特定行

>ENSG00000002587|ENST00000002596 
ATGGCCGCGCTGCTCCTGGGCGCGGTGCTGCTGGTGGCCCAGCCCCAGCTAGTGCCTTCC 
>ENSG00000004059|ENST00000000233 
ATGGGCCTCACCGTGTCCGCGCTCTTTTCGCGGATCTTCGGGAAGAAGCAGATGCGGATT 
>ENSG00000003249|ENST00000002501 
ATGGAGCCCCCGGAGGGCGCCGGCACCGGAGAGATCGTTAAGGAGGCTGAGGTGCCGCAG 
GCTGCGCTGGGCGTCCCAGCCCAGGGGACAGGGGACAATGGCCACACGCCTGTGGAGGAG 
>ENSG00000048028|ENST00000003302 
ATGACTGCGGAGCTGCAGCAGGACGACGCGGCCGGCGCGGCAGACGGCCACGGCTCGAGC 
TGCCAAATGCTGTTAAATCAACTGAGAGAAATCACAGGCATTCAGGACCCTTCCTTTCTC 
CATGAAGCTCTGAAGGCCAGTAATGGTGACATTACTCAGGCAGTCAGCCTTCTCACTGAT 

我想刪除每行其是與>啓動線下的第一個5個字符。 我不知道如何在命令行中做到這一點。你知道嗎?

這裏是預期輸出:

>ENSG00000002587|ENST00000002596 
CGCGCTGCTCCTGGGCGCGGTGCTGCTGGTGGCCCAGCCCCAGCTAGTGCCTTCC 
>ENSG00000004059|ENST00000000233 
CCTCACCGTGTCCGCGCTCTTTTCGCGGATCTTCGGGAAGAAGCAGATGCGGATT 
>ENSG00000003249|ENST00000002501 
GCCCCCGGAGGGCGCCGGCACCGGAGAGATCGTTAAGGAGGCTGAGGTGCCGCAG 
GCTGCGCTGGGCGTCCCAGCCCAGGGGACAGGGGACAATGGCCACACGCCTGTGGAGGAG 
>ENSG00000048028|ENST00000003302 
TGCGGAGCTGCAGCAGGACGACGCGGCCGGCGCGGCAGACGGCCACGGCTCGAGC 
TGCCAAATGCTGTTAAATCAACTGAGAGAAATCACAGGCATTCAGGACCCTTCCTTTCTC 
CATGAAGCTCTGAAGGCCAGTAATGGTGACATTACTCAGGCAGTCAGCCTTCTCACTGAT 

回答

0
sed -E '/^>/{N;s/\n.{5}/\n/}' file 
  • 查找開頭的行>
  • 加入與未來
  • 該行更換新行和五個字符只有換行符