我有一個文本文件有兩列(也許它只是標籤?)。其中一列的數據如下所示:TC012950_CDS_3428_4122
第一個數字是TC#,第二個CDS,第三個起始位置,第四個結束位置。 其他列有一個值是這樣的:11.93631拆分列數據,添加數據,重新合併在一起
我有一個包含由製表分裂染色體信息的另一個文本文件:
ChLG10 protein_coding表達3428 5582。 - 。 TC012950
我的首要目標是最終結合染色體名稱(ChLG10)進入第一個文件的列,因此它看起來像: TC012950_ChLG10_3428_4122
與第二列仍包含其原始值。
我已經嘗試把數據放入數組或數據框,但然後我很難分裂第一列。我不斷收到錯誤,說更換有0行等。因此,我希望也許有人在這裏指出我正確的方向。
如何使用_將第一列分成多列?有沒有辦法將它們分成多個標籤? 之後,我需要將每行與其他數據中的相應行進行匹配,以便我可以將Chr位置列放在TC#和CDS列之間。一旦位於正確的位置,那麼我需要將所有列重新合併在一起,並用_分隔。我在想,如果我用tab做了什麼,那麼我會再用_替換這個選項卡?任何建議或幫助是值得歡迎的。提前感謝你!
有做你的無窮的方法'問,但我們需要一些數據。 – Abdou