考慮以下的數據幀合併兩個長度不同的數據幀:通過更新信息
> tail(tot.final)
names.id sequence names.reads width.reads names.counts st end flag
819 125546 TAGCTTATATGACTGATGTTGACA 125546-4 24 4 8 31 TRUE
820 218783 TCGCTTATCAGACTGATGTTGAAA 218783-2 24 2 8 31 TRUE
821 272992 CAGCTTATCAGACTGATGTTGAAA 272992-2 24 2 8 31 TRUE
822 135191 TAGCTTATCAGACTGATGTTGAACA 135191-4 25 4 8 32 TRUE
823 278047 TAGCTTATCAGACTGATGTTGAAGA 278047-2 25 2 8 32 TRUE
824 317980 TAGCTTATCAGACTGATGTTGCCCT 317980-2 25 2 8 32 TRUE
head(plusa)
names.id sequence names.reads width.reads names.counts st end flag
2 28092 ATCAGACTGATGTTGAC 28092-29 17 29 14 30 TRUE
4 65308 TTATCAGACTGATGTTGA 65308-10 18 10 12 29 TRUE
6 71226 TATCAGACTGATGTTGAC 71226-9 18 9 13 30 TRUE
> nrow(tot.final)
[1] 824
> nrow(plusa)
[1] 421
plusa contains 451 rows with a common plusa$sequence column. (not sorted)
我想通過加入相應的plusa $ names.counts值更新tot.final $ names.counts元件plusa $序列。
考慮到「序列」字段爲id,是否有可能以這種方式合併它們?
問題 - 爲'names.id = 4'和'序列='TTATCAGACTGATGTTGA''在'plusa',該行'tot.final'你應該添加它,因爲它們似乎都具有相同的序列?你是否想要從'plusa'存儲新的'names.id','st','end','width.reads'等等,或者只更新'names.counts'? – 2012-02-06 04:08:28
names.id不計數,它是一個序列id,它與plusa中的序列id不對應。 ;我只想存儲新的names.counts – agatha 2012-02-06 04:16:17
對不起,我誤解了一個序列。所以,如果你在'plusa'中有一行'TAGCTTATCAGACTGATGT',那麼你想添加哪一行'tot.final'(因爲前4個都有相同的序列)?或者你只是想要一個新的數據框'序列'和'計數',其中'TTATCAGACTGATGTTGA''計數'是1505 + 46 + 26 + 23 +無論'plusa'中的任何匹配? – 2012-02-06 04:17:53