我有兩個臨牀程序帳單信息來源,我已經加在一起(與rbind
)。在每一行中都有一個CPT字段和一個CPT.description字段,用於提供簡要說明。但是,這兩個來源的描述略有不同。我希望能夠將它們結合起來。這樣,如果使用不同的單詞或縮寫,那麼我只需要進行字符串搜索即可找到我要查找的內容。將列的兩個元素粘貼(或合併)在一起
因此,我們來構建一個我能夠生成的數據表的簡化表示。
cpt <- c(23456,23456,10000,44555,44555)
description <- c("tonsillectomy","tonsillectomy in >12 year old","brain transplant","castration","orchidectomy")
cpt.desc <- data.frame(cpt,description)
這就是我想要的。
cpt.wanted <- c(23456,10000,44555)
description.wanted <- c("tonsillectomy; tonsillectomy in >12 year old","brain transplant","castration; orchidectomy")
cpt.desc.wanted <- data.frame(cpt.wanted,description.wanted)
我已經使用的功能,例如拆散,然後lapply(列表,膏)嘗試,但沒有被粘貼每個列表的元素。我也試過重塑,但沒有明確的變量來區分第一版或第二版的描述,甚至在某些情況下還有三分之一。真煩人的部分是幾個月或幾年前我有類似的問題,有人幫助我在計算器上或在r幫助和我的生活我無法找到它。
所以潛在的問題是,想象我有一個電子表格在我面前。我需要在相鄰列中執行兩個或甚至三個具有相同CPT代碼的描述單元的垂直合併(粘貼)。
我應該用什麼流行語來搜索這個問題的解決方案。 非常感謝您的幫助。
如果你是用逗號而不是分號OK,你可以做'彙總(描述〜CPT,cpt.desc,的toString)'。用你最喜歡的聚合工具替換'aggregate',並用'paste'替換'toString',如下面的答案所述。 – A5C1D2H2I1M1N2O1R2T1 2017-12-14 08:49:29