好吧最好file1中,所以這將是難以解釋的。請隨身攜帶,並根據需要提出儘可能多的問題。如何匹配和排序的文件2行中的R
我有兩個文件。每個文件都包含一定數量的行和列。每個文件中的第二列包含一個唯一的GENE ID,它們在兩個文件中都是相同的(它們只是在不同的行中)。因此,例如,
文件1可能在第3行(在第二列)中具有基因「LINC00273」,而文件2在第4002行(在第二列中)可能具有「LINC00273」。
我想要做的是我想對文件2進行排序,以便如果文件1行1中的第一個GENE是「VAGAB」,那麼文件2行1的第一個GENE是整個行的「VAGAB」完好無損(該行有覆蓋信息,所以我需要相應地移動數字)。
例如:文件1 [#]對應於行數
[1] GENE100X VAGAB VAGAB 1.0 1.0 1.0 5.0 11198.0
...
[5000] GENE900X ZZZZ ZZZZ 1.0 0 4.2 1.0 78.0
文件2
[1] GENE44X AAAA AAAA 1.0 1.0 1.0 1.0 1.0
...
[5000] GENE106X VAGAB VAGAB 5.0 5.0 5.0 1.0 55.0
文件2所述的預期的輸出將是:
[1] GENE106X VAGAB VAGAB 5.0 5.0 5.0 1.0 55.0
...
[5000] GENE300X ZZZZ ZZZZ 88.0 88.0 1.0 1.0 1.0
所有文件是製表符分隔的。示例中的所有數字(行號和列號)都由它們組成。唯一不會改變的列是第2列和第3列,這兩個文件都是相同的,所以我想用這些排序。
我不想創建第三個文件,如果能有所幫助。我只是希望文件2中的行與文件1中的行相同,並且執行此操作的方法是通過兩個文件的第2列中找到的「基因」名稱來匹配它們。
[R解決方案的首選因爲這是我正在學習,但我會採取任何解決方案中的任何語言,然後我就可以使用它作爲模板來與我自己的R解決方案的實踐之後。
這不只是一個'merge'? – thelatemail
我不想創建第三個文件,我只是試圖重新排序我已有的第二個文件。我並不是100%熟悉合併功能的,只是我現在從幫助頁面讀到的內容。 – System
我嘗試過,但沒有合併不會做我想做的事情。 – System