2016-09-17 41 views
0

我有一個文件,其中我需要進行排序,然後我索引使得文件,我有很多這樣的指標不僅是下面提到的一個對E指標:排序字母和數字列在一起

**chr3 148813677 148815677 ENSG00000071794:I1 -** 
chr3 148804104 148804291 ENSG00000071794:E1 - 
chr3 148804291 148804292 ENSG00000071794:E1 - 
chr3 148804292 148804309 ENSG00000071794:E1 - 
chr3 148804309 148804317 ENSG00000071794:E1 - 
chr3 148804317 148804341 ENSG00000071794:E1 - 
chr3 148802469 148802676 ENSG00000071794:E2 - 
chr3 148801419 148801522 ENSG00000071794:E3 - 
chr3 148793668 148793834 ENSG00000071794:E4 - 
chr3 148792002 148792135 ENSG00000071794:E5 - 
chr3 148791012 148791109 ENSG00000071794:E6 - 
chr3 148789370 148789444 ENSG00000071794:E7 - 
chr3 148802677 148804103 ENSG00000071794:I1 - 
chr3 148801523 148802468 ENSG00000071794:I2 - 
chr3 148793835 148801418 ENSG00000071794:I3 - 
chr3 148792136 148793667 ENSG00000071794:I4 - 
chr3 148791110 148792001 ENSG00000071794:I5 - 
chr3 148789445 148791011 ENSG00000071794:I6 - 
chr3 148789231 148789369 ENSG00000071794:I7 - 

chr3 148789231 148789369 ENSG00000071794:I7 - 
chr3 148789370 148789444 ENSG00000071794:E7 - 
chr3 148789445 148791011 ENSG00000071794:I6 - 
chr3 148791012 148791109 ENSG00000071794:E6 - 
chr3 148791110 148792001 ENSG00000071794:I5 - 
chr3 148792002 148792135 ENSG00000071794:E5 - 
chr3 148792136 148793667 ENSG00000071794:I4 - 
chr3 148793668 148793834 ENSG00000071794:E4 - 
chr3 148793835 148801418 ENSG00000071794:I3 - 
chr3 148801419 148801522 ENSG00000071794:E3 - 
chr3 148801523 148802468 ENSG00000071794:I2 - 
chr3 148802469 148802676 ENSG00000071794:E2 - 
chr3 148802677 148804103 ENSG00000071794:I1 - 
chr3 148802677 148804103 ENSG00000071794:I1 - 
chr3 148804104 148804291 ENSG00000071794:E1 - 
chr3 148804291 148804292 ENSG00000071794:E1 - 
chr3 148804292 148804309 ENSG00000071794:E1 - 
chr3 148804309 148804317 ENSG00000071794:E1 - 
chr3 148804317 148804341 ENSG00000071794:E1 - 

通過除去了2列和每行的3之間的連續順序的任何重複的ID(粗體這種情況下第一行中)。簡而言之,我想根據ID來命令我的行,特別是':'後的所有內容以及第2和第3列中的位置。

回答

2
$ sort -k 4,3 my_file 

chr3 148789231 148789369 ENSG00000071794:I7 - 
chr3 148789370 148789444 ENSG00000071794:E7 - 
chr3 148789445 148791011 ENSG00000071794:I6 - 
chr3 148791012 148791109 ENSG00000071794:E6 - 
chr3 148791110 148792001 ENSG00000071794:I5 - 
chr3 148792002 148792135 ENSG00000071794:E5 - 
chr3 148792136 148793667 ENSG00000071794:I4 - 
chr3 148793668 148793834 ENSG00000071794:E4 - 
chr3 148793835 148801418 ENSG00000071794:I3 - 
chr3 148801419 148801522 ENSG00000071794:E3 - 
chr3 148801523 148802468 ENSG00000071794:I2 - 
chr3 148802469 148802676 ENSG00000071794:E2 - 
chr3 148802677 148804103 ENSG00000071794:I1 - 
chr3 148804104 148804291 ENSG00000071794:E1 - 
chr3 148804291 148804292 ENSG00000071794:E1 - 
chr3 148804292 148804309 ENSG00000071794:E1 - 
chr3 148804309 148804317 ENSG00000071794:E1 - 
chr3 148804317 148804341 ENSG00000071794:E1 -