2016-12-02 44 views
0

在下面的tab-delimitedfile我試圖刪除$1$9和其中的空白空間或數據。我的兩次嘗試似乎只刪除了$1及其中的數據。謝謝 :)。awk刪除其中的字段和空格或數據

文件

R_Index Chr Start End Ref Alt Func.IDP.refGene Gene.IDP.refGene GeneDetail.IDP.refGene Inheritence ID 
1 chr1 40562993 40562993 T C UTR5 PPT1 NM_000310.3:c.-83A>G  1 

AWK

awk '{sub(/^[^\t]*\t/, "") 
gsub(/ /, "") 
}1 
' file  

awk -F'\t' '{$1=x;sub(/^\t/,y)}1' OFS='\t' file 

awk -F'\t' '{$1 && $9=x;sub(/^\t/,y)}1' OFS='\t' file 

期望的輸出

Chr Start End Ref Alt Func.IDP.refGene Gene.IDP.refGene GeneDetail.IDP.refGene ID 
chr1 40562993 40562993 T C UTR5 PPT1 NM_000310.3:c.-83A>G 1 
+0

第一行有'11'字段,第二行有'10'字段....是'「\ t」'分隔符? ....請修復輸入示例 –

+0

我編輯了'file',並且是的,對不起,這是'tab-delimited'以及'output'。 'file'中有'11'字節,'output'中有'9'字段作爲兩個字段,並且數據/空白被刪除。謝謝 :)。 – Chris

+0

請向我們展示試圖刪除「$ 9」的代碼行。 – Jdamian

回答

2

awk噸o救援!

$ awk -F'\t' '{sub(/[^ ]+ /,"",$1);sub(/[^ ]+ /,"",$NF)}1' file1 | 
    column -t 

Chr Start  End  Ref Alt Func.IDP.refGene Gene.IDP.refGene GeneDetail.IDP.refGene ID 
chr1 40562993 40562993 T C UTR5    PPT1    NM_000310.3:c.-83A>G 1 
+0

非常感謝:)。 – Chris