我一直在想我如何做到這一點,但到目前爲止我找不到一個簡單的解決方案。 我有以下數據集:重新組合,總結和組合變量
Itin Origin Destination Passengers
1 A B 1
1 B C 1
2 A B 3
3 E B 10
4 A C 2
5 E B 4
我試圖做的是基於Itin
變量,創建一個路徑變量,同時保持乘客變量。 理解這一點的最簡單方法是將它看作是在某個地方以規模進行正常飛行。例如,在Itin = 1
中,一位乘客從A到B轉到C.唯一需要保留的是起點A
目的地B
,目的地C
和乘客,因爲它等於1.就像下面的示例一樣。
Path Passengers
A-B-C 1
A-B 3
E-B 10
A-C 2
E-B 4
我試過用dplyr GROUP_BY幾個選項,因爲它往往是比基本選項更快,但我不能真正得到的結果作爲一個新的變量Path第二個例子。我也想過使用tidyr,但我不確定它在這裏會有什麼幫助。 關於如何做到這一點的任何想法?
編輯:至於Path變量,結尾爲A-B-C
或A,B,C
或A B C
並不重要,因爲我只會查看語法。
你能假定數據集是排序嗎?即該航班的第一段是該特定行程的第一行。 – thc
@thc是的,它確實按照我以前做過的那樣排序。 – FilipeTeixeira