我有一個製表符分隔的數據框,最後一列包含嵌套信息,即'|'分隔。需要注意的是所有行維持由「REP =」後面這種嵌套的括號結構將嵌套列拆分爲多列UNIX
col1 col2 col3 col4
ID1 text text text...REP=(info1|info2|info3)
ID2 text text text...REP=(info1|info2|info3)
我想處理此最後一列,使得括號內的所有信息是新列:
col1 col2 col3 col4 newcol newcol2 newcol3
ID1 text text text info1 info2 info3
ID2 text text text info1 info2 info3
我會認爲一個AWK命令會很有用,但是在適當地構造這個命令時遇到了麻煩。任何幫助將非常感激。
REP之前的那些點是否真的存在,還是代表更多列? –
...代表col4中發生在'REP ='之前的其他文本 – AMS
「REP」之前是否存在選項卡? –