我有一系列我想要合併的數據幀,按順序累加特定元素。對於背景,這些是用於基因組序列數據的單獨分區文件,其參考沿着比對的基因區域(將其想象爲字符串的部分)。我將序列對齊合併在一起,因此需要將分區文件合併在一起,同時保留分區相對位置。儘可能地將這一點儘可能地適應個別分區文件的任何數目和長度是很好的。R按順序合併元素合併數據幀 - 棘手。
的合併和總結需要工作是這樣的:
- 第二列元素是前行的第三列元素加一。
- 對於第一個數據幀,第三列:第一個元素等於n,第二個元素等於2n,第三個元素是3n,依此類推。
- 在新合併的數據幀中,第三列的第一個元素將成爲其值(x)加上前一個數據幀(x +?n)中第三列的最後一個元素。然後將x添加到每行的x +?n,直到數據幀的結尾或新的一個合併爲止。
一個簡單的例子會更好地解釋。
這裏是1區的數據幀:
V1 V2 V3
Region_1_Partition_1 1 500
Region_1_Partition_2 501 1000
Region_1_Partition_3 1001 1500
這裏是區域2:
V1 V2 V3
Region_2_Partition_1 1 200
Region_2_Partition_2 201 400
Region_2_Partition_3 401 600
最終分區文件需要是這樣的:
V1 V2 V3
Region_1_Partition_1 1 500
Region_1_Partition_2 501 1000
Region_1_Partition_3 1001 1500
Region_2_Partition_1 1501 1700
Region_2_Partition_2 1701 1900
Region_2_Partition_3 1901 2001
我猜猜到目前爲止,還有很多完美的解決方案無法解決!
感謝 Ç
只是嘗試這樣做,效果很好,然後再重新訂購。你有擴大的建議 - 說我非常爲.csv 20+個別分區上的文件? –
我已經編輯了答案,包括我試圖解決這個問題 – HarlandMason