我有一個廣泛格式的數據框,它具有干預前和干預後問卷分數。有848名患者至少有一份問卷。我想看看這些數據來比較分數從干預前到干預後的變化。但是,由於這些數據的格式很廣泛,數據在每個患者的問卷數量方面並不統一,所以我很掙扎。有一個變量列出了調查問卷的實例,問卷的價值是另一個變量。R中的寬格式變量結合
這裏是它目前的樣子的例子:
a=c('instance1','total1','instance2', 'total2', 'instance3', 'total3',
'instance4','total4', 'instance5','total5')
b=c('postop2', '5', 'postop1', '7', NA, NA, 'preop', '10', NA, NA)
c=c(NA, NA, 'preop', '3', NA, NA, 'postop1', '4', 'postop2', '3')
data.frame(rbind(a,b,c))
有848行問卷調查數據。
我需要計算從preop到postop問卷的差異。重組這些數據的最佳方法是什麼,以便我可以獲得這些值?由於所有848名患者之間的情況不一致,我正在掙扎。
感謝您的幫助。
如果你看看你的例子,我假設列名將是第一行而不是'X1','X2'等。 – akrun
是的,列名是第一行 –