我有這樣的數據:如何提取列文本在AWK
COSM3755563_(COSMIC),_COSM3755562_(COSMIC),_rs16941_(Gene_file)
COSM148277_(COSMIC),_COSM3755561_(COSMIC),_rs16942_(Gene_file)
rs1060915_(Gene_file;_1000Genomes)
COSM3755560_(COSMIC),_rs1799966_(Gene_file)
rs206075_(Gene_file;_1000Genomes)
我需要等的輸出:
rs16941
rs16942
rs1060915
rs1799966
rs206075
我只需要在此列中提取rs_number。問題是,rs_number總是在不同的位置。
我的解決辦法是:
awk '{split ($1,arr1,"_"); print arr1[1)}' infile
這工作完全正常,直到我rs_number的改變位置。
感謝awk的幫助。
,添加一個循環,尋找'rs',即'的awk「{N = split($ 1,arr1,「_」);對於(i = 1; i <= n; i ++){if(arr1 [i]〜/^rs.*/)print arr1 [i}}'infile'(可能需要一個大括號不匹配固定)。祝你好運 – shellter